









>ii Rë na Pe AA <= 











Cue. eg mesi. 


William Mendenhall 
($) Terry Sincich = 


mug: 关 静 等 译 EE Ri 


机 械 工 业 出 版 社 


China Machine Press 








“本 书 在 利用 实际 数据 方面 做 了 非常 好 的 工作 …… » 
inda McCann Rhi 3 Hor ese 


“向 学 生 极 其 清楚 地 1i 本 概念 ” 





Arnold Sweet 普度 大 学 


本 书 是 统计 学 方面 的 一 本 经 典 教材 ， 与 其 他 同类 弛 yrd 比 ， 本 书 以 清晰 、 简 洁 的 方式 介绍 
了 统计 学 的 基本 概念 ， 书 中 很 少 涉及 统计 理论 的 严格 数学 证 明 ， 而 是 给 出 了 大 量 与 实际 应 用 紧 
密 联系 的 例子 和 练习 ， 这 些 例子 涉及 数 、 理 、 化 、 天 文 、 地 理 、 生 物 等 自然 科学 以 及 几乎 所 有 
工程 技术 领域 ， 有 助 于 激发 学 生 的 学 习 兴趣 和 启发 学 生 利用 所 学 方法 解决 实际 问题 。 此 外 ， 本 
书 附录 部 分 还 介绍 了 SAS、MINITAB、SPSS 等 统计 软件 的 使 用 方法 。 


本 书 可 作为 理工 科 各 专业 本 科 生 或 研究 生 的 统计 学 教材 ， 也 可 作为 工程 技术 领域 研究 人 员 
的 参考 书 。 
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本 书 是 一 本 联系 实际 应 用 的 统计 教材 . 全 书 共 17 章 , 主要 介绍 描述 性 统计 、 概率、 离散 随 
机 变量 、 连 续 随机 变量 、 二 元 概率 分 布 及 抽样 分 布 、 置 信 区 间 估 计 、 假 设 检 验 、 分 类 数据 分 析 、 
简单 线性 回归 、 多 重 回归 分 析 、 模型 构造 、 试 验 设计 的 原则 、 试 验 设计 的 方差 分 析 、 非 参数 统 
计 、 统计 过 程 和 质量 控制 、 产 品 和 系统 的 可 靠 性 . 此 外 , 本 书 的 附录 部 分 还 介绍 了 一 些 统计 软 
件 的 使 用 方法 . 

本 书 内 容 丰 富 , 很 少 涉及 统计 学 理论 的 严格 数学 证 明 , 绝 大 部 分 是 与 实际 应 用 紧密 联系 的 
例子 和 练习 , 适合 作为 理工 科 各 专业 本 科 生 、 研 究 生 的 统计 学 教材 , 也 可 作为 相关 领域 研究 人 
员 的 参考 读物 . 
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本 书 概要 


本 书 是 为 工程 专业 和 自然 科学 专业 的 学 生 设 计 的 、 供 两 个 学 期 使 用 的 统计 学 课程 教材 . 一 旦 这 
些 学 生 毕 业 , 并 且 找到 了 工作 , 他 们 就 将 涉及 数据 的 收集 和 分 析 , 并 且 需 要 批判 性 地 思考 结果 . 这 就 
要 求 他 们 了 解数 据 描述 及 统计 推断 的 基本 概念 , 并 且 熟 悉 工作 中 需要 用 到 的 统计 方法 . 


教学 法 


第 1 ~6 章 介 绍 学 习 统计 学 的 目的 , 说 明 如 何 描述 数据 集 , 并 且 给 出 一 些 概率 论 的 基本 概念 . 第 
7 章 和 第 8 章 介 绍 关于 总 体 参数 的 两 种 推断 方法 : 估计 和 假设 检验 . 这 些 概念 在 其 余 几 章 中 被 扩展 为 
在 分 析 工 程 和 科学 数据 时 有 用 的 主题 , 包括 分 类 数据 分 析 ( 第 9 章 )、 回 归 分 析 以 及 模型 构造 (第 
10 —12 章 )、 试 验 设 计 的 方差 分 析 ( 第 13 ~ 14 章 )、 非 参数 统计 (第 15 章 ) 、 统计 质 量 控制 (第 16 章 ) 
以 及 产品 和 系统 的 可 靠 性 (第 17 3€). 

我 们 假定 读者 学 习 了 两 个 学 期 的 微 积分 学 , 即 读者 对 微 积分 学 原理 有 一 个 基本 了 解 . 要 求 读者 
具有 运用 一 元 微分 法 和 积分 法 的 能 力 , 但 书 中 也 有 一 些 有 关 多 元 微 积分 的 例题 , 作为 选 学 内 容 . IN 
此 , 我 们 在 一 元 范围 内 只 是 概括 地 介绍 理论 概念 , 但 是 教师 利用 选 学 内 容 、 例题 以 及 练习 可 以 很 容 
易 地 将 其 深入 到 统计 学 理论 和 数学 概念 之 中 ， | 


本 书 特色 


本 书 的 主要 特色 如 下 : 

1. 理论 和 应 用 相 结 合 . 将 数理 统计 的 基本 理论 概念 整合 为 一 门 统计 方法 的 课程 ， 供 两 个 学 期 讲 
授 . 因此 , 教师 可 以 选择 将 其 作为 以 基本 概念 和 应 用 统计 为 重点 的 一 门 课程 , 也 可 以 作为 偏向 应 用 
又 介绍 基本 统计 推断 理论 方法 的 一 门 课程 . f 

2. 统计 软件 应 用 指导 . 老师 和 学 生 可 以 选用 统计 软件 进行 统计 计算 . 本 书 介绍 了 三 个 流行 的 统 
计 软 件 包 (SAS、SPSS 以 及 MINITAB) 的 输出 结果 以 及 Microsoft Excel 的 输出 结果 . 附录 C、 附 录 D 以 
及 附录 EE 介 绍 了 菜单 屏幕 和 对 话 框 的 使 用 , 是 为 初学 者 设计 的 , 这 些 辅导 材料 不 需要 预先 使 用 这 些 
软件 的 经 验 . 

3. 主题 和 应 用 的 结合 范围 . 为 了 满足 未 来 工程 师 和 科学 家 的 种 种 需要 , 本 书 提供 了 覆盖 范围 广 
泛 的 数据 分 析 主 题 . 本 书 对 多 元 回归 以 及 模型 构造 (第 11 章 和 第 12 章 ) 、 试 验 设计 的 原理 (第 13 
章 )、 质 量 控制 (第 16 章 ) 以 及 可 靠 性 (第 17 章 ) 等 内 容 的 安排 与 通常 的 初等 统计 学 教程 不 同 . 虽然 
这 些 题材 通常 涉及 理论 概念 , 但 是 讲述 是 面向 应 用 的 . 

4. 基于 大 量 实际 数据 的 练习 . 本 书包 含 了 大 量 的 应 用 练习 , 主要 是 为 了 激发 学 生 的 学 习 兴 趣 和 
启发 学 生 利用 所 学 方法 解决 实际 问题 . 几乎 每 一 个 练习 都 是 基于 摘自 专业 期 刊 或 者 从 工程 和 自然 科 
学 团体 得 到 的 数据 或 试验 结果 . 练习 放 在 每 章 重点 节 的 末尾 以 及 各 章 的 末尾 . 


译 者 = 


国内 已 经 出 版 了 许多 统计 学 方面 的 教材 , 包括 国内 专家 学 者 编写 的 以 及 翻译 的 , 都 各 有 特点 . 
本 书 是 佛罗里达 大 学 William Mendenhall 教授 与 南 佛罗里达 大 学 Terry Sincich 副教授 编写 的 《 Statistics 
for Engineering and the Sciences》 的 第 5 版 , E 2007 年 出 版 以 来 , 得 到 了 许多 同行 的 肯定 评价 , 被 称赞 
为 “是 一 本 真正 经 典 的 统计 方面 的 教材 ”,“ 容 易 读 ”,“ 在 利用 实际 数据 方面 做 出 了 非常 出 色 的 工 
作 ”,“ 向 学 生 们 极其 清楚 地 讲述 了 统计 学 /概率 论 的 基本 概念 ”. 

本 书 作为 理工 科 各 专业 本 科 生 的 统计 学 考 材 ,并 不 十 分 强调 统计 学 理论 的 严格 数学 证 明 . 在 这 
样 一 本 大 部 头 著作 中 , 证 明 只 占 很 少 一 部 分 , 绝 大 部 分 是 与 实际 应 用 紧密 联系 的 例子 与 练习 . 本 书 
的 最 大 特点 : 联系 实际 . 全 书 给 出 了 近 250 个 例题 、1200 道 练习 题 , 每 章 最 后 还 有 一 节 “STATISTICS 
IN ACTION" , 我 们 译 成 “活动 中 的 统计 学 ”", 所 有 这 些 都 是 由 活跃 在 各 个 领域 的 工程 师 、 科 学 家 以 及 
统计 学 家 提供 的 有 据 可 查 ( 表 明了 出 处 ) 的 真实 例子 . 这 些 例子 涉及 数 、 理 、 化 、 生 、 地 、 天 文 等 自然 
科学 , 以 及 几乎 所 有 工程 技术 领域 . 除了 少量 的 理论 练习 ,每 个 应 用 练习 都 有 一 个 标题 . 有 些 问 题 的 
标题 可 能 多 处 出 现 , 如果 将 它们 串 在 一 起 ,就 构成 这 个 问题 由 浅 入 深 的 研究 过 程 . 

本 书 的 第 二 个 特点 是 介绍 了 统计 软件 的 应 用 . 统计 学 是 数据 的 科学 , 一 个 真实 的 统计 问题 离 不 
开 统 计数 据 的 大 量 计算 . 书 中 的 练习 当然 只 能 列 出 其 中 一 小 部 分 数据 ,附录 中 有 SAS, MINITAB, 
SPSS 等 统计 软件 的 用 法 简介 . 有 兴趣 利用 统计 软件 解决 实际 问题 的 读者 ， 可 从 华章 网 站 
(www. hzbook. com) 下 载 包含 全 部 数据 的 文件 , 按 相应 练习 中 的 要 求 , 解释 运行 结果 , 这 是 十 分 有 
益 的 . 

我 们 翻译 的 是 原著 的 第 5 版 , 它 在 前 几 版 的 基础 上 增加 了 许多 新 内 容 . 全 书 共 17 章 , 包括 了 统 
计 学 的 基本 内 容 , 其 中 有 不 少 是 国内 高 校 < 统计 学 ”课程 中 没有 或 很 少 提 及 的 , 如 试验 设计 、 统计 质 
量 控制 、 可 靠 性 等 . 每 章 末 有 快速 回顾 ， 帮 助 读者 更 好 、 更 快 地 掌握 内 容 ， 

翻译 这 样 一 本 大 作对 我 们 的 水 平和 耐心 是 一 次 考验 . 虽然 在 我 们 共同 努力 下 , 克服 困难 , 完成 
了 任务 , 但 其 中 肯定 存在 不 少 问题 , 特别 是 某 些 专业 术语 的 翻译 , 借助 于 互联 网 , 可 以 找到 许多 相关 
的 意义 ， 而 我们 以 前 又 从 来 没有 接触 过 这 个 领域 , 因此 有 时 只 能 望 文生 义 选择 我 们 认为 比较 合适 的 
译名 . 参与 本 书 翻译 的 有 : AEB., AP, RAR SAM, FAR ATE, h, EA a, 
RE RE IU E. 其 中 关 静 负责 前 9 章 , 梁 汉 珍 负责 后 8 章 , 最 后 由 史 道 济 审 校 定稿 . 由 于 我 们 水 
平 有 限 ， 翻 译 不 当 之 处 在 所 难免 , 恳请 广大 专家 及 读者 指出 , 不 胜 感激 . 





译 者 
2009 年 5 月 
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5. “活动 中 的 统计 学 ”案例 分 析 . 现在 本 书 在 每 章 末 尾 新 增 了 一 个 当代 的 科学 研究 (“活动 中 的 
统计 学 ” ) 以 及 附带 的 数据 与 分 析 . 我 们 的 目的 是 向 学 生 展 示 评 估 发 现 和 思考 涉及 的 统计 间 题 , 以 及 
应 用 正确 的 统计 方法 的 重要 性 . 

6. 在 线 提供 数据 集 . 与 例题 、 练 习 以 及 案例 有 关 的 所 有 数据 集 都 可 以 从 网 上 在 线 获得 . 每 个 数 
据 集 在 本 书 中 都 有 一 个 CD 图 标 和 文件 名 . 数据 文件 以 5 种 不 同 的 格式 (MINITAB、SAS、SPSS、Excel 
和 ASCI ) 保 存 (以 便 易 于 导入 其 他 统计 软件 包 中 ). 利用 统计 软件 分 析 这 些 数据 , 将 计算 减少 到 最 低 
限度 , 使 学 生 可 以 集中 精力 解释 结果 . 


第 5 版 的 更 新 之 处 


虽然 目的 和 范围 与 以 前 版 本 是 一 样 的 , 但 是 本 书 的 第 5 版 包含 若干 重要 的 改动 、 增补 和 加 强 : 

1. 每 章 末 尾 的 “活动 中 的 统计 学 "案例. 正如 上 面 提 到 的 , 现在 本 书 在 每 章 末 尾 增 加 了 一 个 实际 
的 最 新 科学 研究 的 讨论 . 详细 地 讨论 数据 和 分 析 ， 从 而 展示 本 章 的 统计 方法 是 怎样 用 来 回答 此 领域 
里 的 相关 问题 的 . 

2. 最 新 的 统计 软件 输出 结果 . 在 本 书 中 , 我 们 增加 了 大 量 输出 结果 , 包括 最 新 版 本 的 SPSS 和 
Excel 输出 结果 以 及 最 新 的 SAS 和 MINITAB 输出 结果 . 输出 结果 及 相关 的 每 种 统计 方法 使 教师 能 够 
把 重点 放 在 对 统计 结果 的 解释 上 , 而 不 是 把 重点 放 在 为 了 得 到 结果 而 需要 的 计算 上 . 

3. 章 末 的 总 结 材料 . 在 每 一 章 的 末尾 , 我 们 通过 快速 回顾 、 符 号 汇集 以 及 每 章 总 结 提示 ,提供 
一 个 主题 概要 . 这 些 可 以 帮助 学 生 总 结 和 提炼 本 章 的 重点 , 是 有 用 的 学 习 工 具 . 

4. 更 多 的 实际 数据 练习 . 本 书 添加 了 许多 新 的 “现实 ”的 科学 练习 . 它们 全 都 来 自 报刊 、 科 学 杂 
志 以 及 专业 学 报 . 

5. 第 1 章 : 统计 学 和 批判 性 思考 . 增加 了 统计 学 在 评估 由 数据 作出 推断 的 可 信 性 与 价值 中 的 作 
用 一 节 , 即 统计 学 在 批判 性 思考 中 的 作用 (1.4 节 ). 

6. 第 2 章 : 描述 性 统计 和 焉 曲 事实 真相 . 在 新 的 2.8 节 中 包含 了 一 些 例题 , 用 来 说 明 图 形 和 数字 
描述 性 度量 如 何 焉 曲 对 数据 的 观察 , 以 及 当 这 种 事情 发 生 时 , 怎样 认识 它 . 

7. 第 4~6 章 : 随机 变量 的 标准 数学 符号 . 在 有 关 随 机 变量 的 各 章 中 , 我 们 都 使 用 标准 的 数学 符 
号 来 表示 一 个 随机 变量 . 大 写字 母 用 于 表示 随机 变量 , 小 写字 母 表 示 随 机 变量 的 可 能 取 值 . 

8. 第 6 章 : 蒙特 卡 罗 (Monte Carlo) 模拟 . 我 们 通过 6.8 节 中 的 例题 强调 用 蒙特 卡 罗 模 拟 逼 近 抽 
样 分 布 . 

9. 第 7 章 和 第 8 XE: 自助 法 和 贝 叶 斯 方法 . 现在 新 的 可 选 小 节 给 出 另外 两 种 估计 方法 (7. 12 节 ) 
以 及 假设 检验 方法 (8. 13 节 ) 自助 法 和 贝 叶 斯 方法 ， 

10. 第 9 章 : 列 联 表 的 精确 检验 . 新 的 可 选 小 节 (9.6 节 ) 给 出 了 2 x 2 列 联 表 独立 性 的 费 希 尔 
( Fisher) 精确 检验 . 

11. 第 11 章 : 多 元 回归 模型 . 在 第 11 章 的 不 同 小 节 中 给 出 了 几 个 不 同 的 多 元 回归 模型 : 一 阶 模 
型 (11.7 节 )、 交 互 作 用 模型 (11.8 节 ) 以 及 二 阶 模型 (11. 9 45). 

12. 8812 章 : 外 部 模型 确认 . 在 第 12 章 中 增加 了 外 部 确认 多 元 回归 模型 有 效 性 的 可 选 小 节 
(12.9 节 )， 讨 论 了 交叉 确认 法 和 刀 切 法 . 

13. 第 13 章 和 第 14 章 : 试验 设计 和 方差 分 析 . 以 往 关 于 方差 分 析 的 题材 现在 分 成 两 章 :“ 试 验 
设计 的 原理 “第 13 章 ) 和 “试验 设计 的 方差 分 析 ”( 第 14 EE). 
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14. $8 16 & ; 能 力 分 析 . 在 有 关 统 计 过 程 和 质量 控制 的 一 章 中 现在 包括 了 有 关 能 力 分 析 重 要 性 
的 新 的 可 选 小 节 (16.9 节 ). 

全 书 还 有 许多 细节 上 不 是 很 明显 的 变化 , 这 是 按照 本 书 当 前 的 读者 和 审阅 人 的 建议 作出 的 
修改 . 
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习 的 完全 解答 . 
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第 1 章 绪 论 
目标 ”认识 统计 学 在 分 析 工 程 技术 和 自然 科学 数据 中 的 作用 . 


1.1 统计 学 : 数据 的 科学 


根据 《 兰 登 书屋 大 学 字典 》( The Random House College Dictionary) ,统计 学 是 “对 用 数字 表示 的 
事实 或 数据 进行 收集 、 分类、 分 析 以 及 解释 的 科学 ”. 简 而 言 之 , 统计 学 就 是 数据 的 科学 . 

定义 1.1 统计 学 是 数据 的 科学 . 它 包 括 数据 的 收集 、 分 类 、 概 括 、 整 理 、 分 析 以 及 解释 . 

统计 学 通常 应 用 于 两 种 类 型 的 问题 : 

i. 概括、 描述 以 及 探索 数据 . 

2. 利用 样本 数据 推断 被 选取 样本 的 数据 集 的 性 质 . 

作为 一 个 描述 统计 应 用 的 例子 , 考虑 美国 的 人 口 普查 , 它 涉及 数据 集 的 收集 , 目的 在 于 反映 生活 在 
美国 的 大 约 29 500 万 人 口 的 社会 经 济 特征 . 对 于 计算 机 软件 工程 师 来 说 , 管理 这 个 巨大 的 数据 库 , 其 中 
一 个 问题 就 是 利用 统计 方法 描述 数据 . 类 似 地 , 一 位 环境 工程 师 利用 统计 学 描述 一 个 数据 集 , 这 个 数据 
集 记录 了 工厂 在 过 去 一 年 中 氧化 硫 的 日 排放 量 . 致力 于 这 些 应 用 的 统计 学 分 支 称 为 描述 性 统计 . 

定义 1.2 致力 于 数据 集 的 整理 、 概 括 以 及 描述 的 统计 学 分 支 称 作 描述 性 统计 . 

有 时 数据 集 刻画 的 是 一 种 感 兴趣 的 现象 , 这 样 的 数据 集 在 自然 状态 下 是 无 法 得 到 的 、 代 价 昂贵 
或 者 耗费 时 间 才 能 获得 的 . 在 这 种 情况 下 , 我 们 得 到 数据 的 一 个 子 集 ( 称 为 样本 ), 利用 这 个 样本 信 
息 来 推断 它 的 性 质 . 为 了 说 明 概 念 , 假定 感 兴趣 的 现象 是 在 一 个 有 人 居住 但 偏僻 的 太平 洋 岛 上 饮用 
水 的 质量 . 你 可 能 期 望 水 的 质量 依赖 于 水 的 温度 、 近 期 降雨 量 大 小 等 因素 . 实际 上 , 如果 在 同一 个 地 
区 相同 时 刻 重复 测量 水 的 质量 , 即使 在 水 温 相 同 的 情况 下 , 质量 测量 值 也 会 变化 . 因此 ,“ 饮 用 水 的 
质量 "现象 由 一 个 很 大 的 数据 集 来 刻画 , 而 这 个 数据 集 由 许多 个 (事实 上 是 无 限 多 个 ) 水 的 质量 测量 
值 组 成 一 一 一 个 只 是 概念 上 的 数据 集 . 为 了 确定 这 个 数据 集 的 性 质 , 我 们 从 中 抽样 ， 即 我 们 记录 在 
特殊 的 时 间 和 地 点 收集 到 的 ” 份 水 样本 的 质量 , 然后 利用 这 个 质量 测量 值 的 样本 推断 感 兴趣 的 概 
念 上 很 大 的 数据 集 的 性 质 . 解决 这 类 问题 的 统计 学 分 支 称 为 推断 统计 学 . 

定义 1.3 利用 样本 数据 对 一 个 很 大 的 数据 集 作出 推断 的 统计 学 分 支 称 作 推断 统计 学 


1.2 统计 学 的 基本 要 素 


在 统计 学 术语 中 , 我 们 把 想 要 描述 的 数据 集 或 刻画 了 我 们 感 兴趣 现象 的 数据 集 称 为 总 体 . 这 样 ， 
我 们 可 以 将 样本 定义 为 取 自 总 体 的 数据 的 子 集 . 有 时 ，, 总体 和 样本 这 两 个 词 用 来 表示 对 象 集 和 对 它 
进行 的 测量 ( 即 试验 单位 集 ). 在 一 项 研究 中 ， 这 些 术语 的 意义 从 它们 的 上 下 文中 可 以 清楚 地 看 出 . 

定义 1.4 统计 总 体 是 我 们 感 兴趣 的 目标 的 数据 集 ( 通 常 很 大 ， 有 了 时 是 概念 上 的 ). 

定义 1.5 样本 是 取 自 目标 总 体 的 数据 子 集 

定义 1.6 测量 值 采集 的 对 象 (例如 ， 人、 事物 、 交 易 、 标 本 或 者 事件 ) 称 作 试验 单位 . 

注 : 一 个 总 体 由 对 许多 试验 单位 采集 的 数据 组 成 . 

在 研究 总 体 和 样本 的 过 程 中 , 我 们 专注 于 总 体 试验 单位 的 一 个 或 多 个 特征 或 性 质 , 统计 学 称 这 
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些 特征 为 变量 . 例如 , 在 饮用 水 质量 的 研究 中 , 工程 师 感 兴趣 的 两 个 变量 是 在 100 mL 的 水 样本 中 ， 
氯 的 残留 量 ( 按 每 百 万 的 含量 测量 ) 以 及 排泄 物 大 肠 杆 菌 的 数量 . 

定义 1.7 变量 是 单个 试验 单位 的 特征 或 性 质 . 

EÜ 肯塔基 大 学 运输 研究 项 目的 工程 师 们 收集 了 发 生 在 肯塔基 列 克星 敦 交 叉 路 口 的 事故 数据 . 
研究 目的 之 一 是 估计 在 没有 只 许 左 转弯 车 道 的 交叉 路 口 发 生 左 转弯 事故 的 比例 . 这 个 估计 值 将 用 来 
在 所 有 的 列 克星 敦 主要 交叉 路 口 设 置 左 转弯 车 道 提供 数值 理由 (或 准则 ). 工程 师 们 用 一 年 多 的 时 间 
收集 了 50 个 没有 只 许 左 转弯 车 道 的 主干 道上 交叉 路 口 的 事故 数据 . 在 每 个 交叉 路 口 , 他 们 监测 通行 
车 辆 并 记录 发 生 事故 的 左 转弯 汽车 的 总 数 . 

a. 确定 这 项 研究 的 变量 以 及 试验 单位 . 

b. 描述 目标 总 体 以 及 样本 . 

c. 运输 工程 师 想 要 作出 什么 推断 ? 

解 a 由 于 工程 师 收集 了 50 个 交叉 路 口 的 数据 , 试验 单位 是 没有 左 转弯 车 道 的 交叉 路 口 . 测量 
的 变量 是 发 生 事故 的 左 转弯 汽车 总 数 . 

b. 研究 的 目的 是 对 于 所 有 列 克 星 敦 的 主要 交叉 路 口 设置 左 转弯 车 道 提 出 一 些 准 则 ; 因此 , H 
标 总 体 由 这 个 城市 所 有 主要 交叉 路 口 组 成 . 样本 由 工程 师 监测 的 50 个 交叉 路 口 的 子 集 组 成 . 

c. 工程 师 将 利用 样本 数据 估计 发 生 在 列 克 星 敦 的 所 有 主要 交叉 路 口 的 左 转弯 事故 的 比例 (在 
第 7 章 中 我 们 将 知道 这 个 估计 值 是 样本 中 左 转弯 事故 的 个 数 除 以 样本 中 左 转弯 的 汽车 总 数 . ) 

前 面 的 定义 和 例题 给 出 了 推断 统计 问题 5 个 要 素 中 的 4 个 : 总 体 、 一 个 或 多 个 感 兴趣 的 变量 、 
样本 以 及 推断 . 第 5 个 要 素 是 关于 知道 这 个 推断 如 何 有 效 , 即 推断 的 可 靠 性 . 推断 的 可 靠 性 度量 将 统 
计 学 和 算命 术 区 分 开 来 . 与 统计 学 家 一 样 , 看 手相 的 可 能 会 检查 一 个 样本 (你 的 手 ) 并 对 总 体 (你 将 
来 的 寿命 ) 作 出 推断 . 但 是 和 统计 推断 不 同 , 看 手相 的 推断 不 包括 推断 有 多 大 可 能 是 真实 的 度量 . 

为 说 明 间 题 , 考虑 例 1. 1 中 运输 工程 师 在 肯塔基 列 克星 敦 交 又 路 口 处 左 转弯 交通 事故 比例 的 
估计 . 工程 师 们 感 兴趣 的 是 估计 的 误差 ( 即 样本 事故 发 生 率 和 目标 总 体 事故 发 生 率 之 间 的 差异 ). 
利用 统计 方法 , 我 们 可 以 给 出 一 个 估计 误差 的 界 . 这 个 界 是 一 个 数 (如 10% ) , 我 们 的 估计 误差 不 
大 可 能 超过 它 . 在 后 面 的 章节 中 , 我 们 将 会 学 习 用 这 个 界 来 帮助 度量 推断 的 “置信 和 度 ”. 全 书 都 会 
讨论 统计 推断 的 可 靠 性 . 现在 , 已 经 简单 地 认识 到 没有 可 靠 性 来 度量 的 推断 是 不 完整 的 . 

定义 1.8 可 靠 性 度量 是 关于 统计 推断 不 确定 程度 的 一 个 陈述 (通常 是 定量 的 ). 

下 面 给 出 了 描述 性 统计 和 推断 性 统计 问题 所 包含 的 要 素 . 





























描述 性 统计 问题 的 4 要 素 
L 感 兴趣 的 总 体 或 样本 . 
2. 被 研究 的 一 个 或 多 个 变量 ( 总 体 或 样本 单位 的 特征 ). 
3. 表格 、 图 形 或 者 数字 概括 工具 
4 确定 数据 类 型. 
推断 性 统计 问题 的 5 要 素 
1. 感 兴趣 的 总 体 . 
2. 被 研究 的 一 个 或 多 个 变量 (试验 单位 的 特征 ). 
3. 试验 单位 的 样本 . 








a 论 











4. 基于 包含 在 样本 中 的 信息 对 总 体 的 推断 、 
5. 推断 的 可 靠 性 度量 . 








(8) 应 用 练习 


1. 


一 


一 


一 


1 钢 的 防腐 研究 . 希腊 雅典 国家 技术 大 学 材料 科 

学 与 工程 系 的 研究 者 检测 了 钢 表 层 的 不 同 环 氧 涂 

层 的 防腐 性 能 . (Pigment & Resin Tecthnology , 32 

卷 , 2003) 从 一 卷 薄 钢板 上 切 下 几 条 钢 片 , 涂 上 4 

种 不 同类 型 环 氧 层 (S1、S2、53 以 及 S54) 中 的 一 种 . 

将 这 些 钢 片 放 在 水 中 一 天 后 , 确定 每 个 钢 片 的 腐 

Thais ( 2640803273 Jy J 38). 

a. 这 个 研究 的 试验 单位 是 什么 ? 

b. 假设 你 仅 对 描述 涂 上 SI 类 型 的 环 氧 层 的 钢板 的 
腐蚀 率 感 兴趣 , 定义 目标 总 体 以 及 相关 的 样本 . 





.2 软件 重新 使 用 的 成 功 或 失败 ,由 涛 太 华 大 学 主 


持 的 软件 工程 知识 库 PROMISE 软件 是 一 个 公开 的 
通用 数据 集 , 为 研究 者 建立 预测 软件 模型 提供 服 
务 . 有 关 软 件 重新 使 用 的 PROMISE 数据 集 保存 在 
SWREUSE 文件 中 , 对 于 24 个 新 软件 开发 项 目 样本 
中 的 每 个 项 目 , 它 提供 了 利用 以 前 开发 的 软件 是 
成 功 或 者 失败 的 信息 . (数据 来 源 : IEEE Transac- 
tions on Sofiware Engineering , 28 卷 , 2002. ) 在 24 个 
项 目 中 , 9 个 失败 ,15 个 成 功 运行 . 

a. 确定 这 个 研究 的 试验 单位 . 

b. 描述 样本 所 来 自 的 总 体 . 

c. 利用 样本 信息 对 总 体 作 出 推断 . 


.3 由 杀 虫 剂 引起 的 果树 污染 ,将 杀 虫 剂 用 于 一 大 


批 成 熟 的 庄稼 无 疑 会 导致 周围 空气 的 污染 . Envi- 
ronmental Science & Technology ( 1993 年 10 H ) 刊登 
了 在 加 利 福 尼 亚 州 圣 华 金 河 谷 的 休眠 果园 使 用 杀 
虫 剂 毒 死 昕 后 硫 的 残留 量 . 收集 了 一 个 果树 林 在 一 
段 喷 酒 较 密集 的 时 期 (总 共 13 天 ) 每 天 的 周围 空气 
样本 , 测量 了 每 天 的 硫 含量 水 平 (ng/mi ). 

a. 确定 研究 者 感 兴趣 的 总 体 . 

b. 确定 样本 . 


.4 地 震 的 地 表 运 动 . 在 Journal of Earthquake En- 


gineering (2004 年 11 A), 一 个 由 土木 工程 师 和 
环境 工程 病 组 成 的 团队 研究 了 发 生 在 1940 年 至 
1995 年 之 间 , 世界 范围 内 的 15 次 地 震 的 地 表 运 
动 特征 . 每 次 地 震 测量 的 三 个 (多 个 ) 变 量 是 地 表 
运动 的 类 型 ( 短 、 长 或 者 向 前 )、 地 震 的 震级 (里 
RRR) 以 及 最 大 地 表 加 速度 (fis). 研究 目的 之 
一 是 估计 任意 地 表 运 动 周期 的 非 弹 性 谱 . 


一 


一 


一 


一 


a. 确定 此 研究 的 试验 单位 . 


b. 15 次 地 震 的 数据 代表 一 个 总 体 还 是 一 个 样本 ? 
说 明 原 因 . 


.5 计算 机 电源 系统 负载 电流 . 电子 工程 师 发 现 计 


算 机 电源 系统 中 有 高 的 中 性 线 电流 是 一 个 潜在 的 
问题 . 为 了 确定 问题 的 范围 ,他 们 对 146 个 美国 站 


点 的 计算 机 电源 系统 的 负载 电流 进行 了 调查 ( IEEE 


Transactions on Industry Applications, 1990 年 7/8 
HO. 调查 显示 , 有 高 的 中 性 线 电流 的 站 点 对 满载 
电流 站 点 的 比例 不 到 10%. 

a. 确定 感 兴趣 的 总 体 . 

b， 确 定 样本 . 

c， 利 用 样本 信息 作出 关于 总 体 的 推 斯. 


.6 蔬菜 的 预 冷 . 为 了 给 市 场 准备 佛罗里达 蔬菜 ， 


研究 者 开发 了 一 种 新 的 预 冷 方法 . 系统 利用 设计 的 
空气 和 水 的 混合 , 迫使 比 常 规 水 冷 法 更 低温 的 水 
流 来 有 效 地 冷却 . 为 了 比较 两 种 系统 的 有 效 性 , 将 
20 批 新 鲜 的 西红柿 分 成 两 部 分 : 一 部 分 用 新 方法 
冷却 , 男 一 部 分 用 常规 方法 冷却 . 记录 了 为 有 效 冷 
却 每 批 西红柿 所 需 的 水 量 (加 仑 , 1 英 加 仑 =4. 546 
Jr, 1 美加 仑 =3. 785 F). 

a 确定 这 个 问题 的 总 体 、 样 本 以 及 所 做 的 统计 推 

断 类 型 ， 
b. 怎样 利用 样本 数据 比较 两 种 系统 的 冷却 效率 ? 


.7 每 周一 氧化 碳 数据 . 温室 效应 气体 的 世界 数据 


中 心 收集 并 保存 了 温室 以 及 空气 中 相关 气体 的 数 

据 . 其 中 一 个 数据 集 列 出 了 位 于 阿拉 斯 加 科 尔 德 湾 

气象 站 的 空气 中 每 周一 氧化 碳 的 含量 (十 亿 分 之 

一 ). 2000 年 至 2002 年 的 每 周 数据 保存 在 COGAS 

文件 中 ， 

a， 确 定 被 测量 的 变量 以 及 相应 的 试验 单位 . 

b. 如 果 你 仅 对 描述 2000 年 至 2002 年 中 科 和 尔 德 
湾 站 的 每 周一 氧化 碳 的 值 感 兴趣 , 那么 数据 
代表 的 是 总 体 还 是 样本 ? 说 明 原 因 . 


.8 检测 次 品 . 检查 一 条 生产 线 上 所 有 产品 中 的 次 


品 是 一 个 花费 大 且 耗 时 的 过 程 . 检查 次 品 的 一 个 有 
效 且 经 济 的 方法 是 由 质量 控制 工程 师 选 择 并 检查 
一 部 分 产品 . 计算 在 检查 产品 中 次 品 的 百分比 , 然 
后 用 它 估计 这 条 生产 线 上 所 有 产品 中 有 次 品 的 百 分 
比 . 对 这 个 问题 确定 总 体 、 样 本 以 及 统计 推断 类 型 . 





1.3 数据 类 型 > 


数据 分 为 定量 和 定性 两 种 类 型 2. 定量 数据 表示 事物 的 数量 或 个 数 ， 用 数值 标 度 度量 . 例如 , 电 
源 频率 (MHz) 是 一 个 定量 变量 , 类 似 于 钢管 的 断裂 强度 (lb/in? , 磅 /平方 英寸 ). 与 之 相反 , 定性 (或 
分 类 ) 数 据 没 有 量 的 解释 , 它们 只 能 分 类 . 相应 于 一 组 个 工科 毕业 生 , n 个 职位 集合 是 一 个 定性 数 
ER. 防腐 环 氧 涂 层 中 使 用 的 色素 种 类 ( 锌 或 云母 ) 也 表示 为 定性 数据 ， 

定义 1.9 定量 数据 表示 事物 的 数量 或 个 数 . 

定义 1. 10 ”定性 数据 没有 量 的 解释 , 即 它们 只 能 以 类 型 分 类 . 
RED Journal of Performance of Constructed Facilities (1990 年 2 月 ) 报告 了 费城 地 区 配水 网 络 的 性 
SER BE. 作为 研究 的 一 部 分 , 测量 了 每 个 抽样 水 管 截面 的 如 下 变量 , 确定 每 个 变量 产生 的 数据 是 定 
量 的 还 是 定性 的 . 

a. 水 管 直径 (in). 

b. 水 管材 料 ( 钢 铁 或 者 PVC). 

c. 水 管 位 置 (市 中 心 或 者 郊区 ). 

d. 水 管 长 度 (ft). 

解 水 管 直 径 (in) 以 及 水 管 长 度 (tt) 都 是 用 有 意义 的 数值 标 度 度量 的 . 因此 ， 这 两 个 变量 产生 定 
量 数据 , 水 管材 料 和 水 管 位 置 只 能 分 类 一 一 材料 是 钢铁 或 者 PVC; BEER nop SERERE. 因此 , 水 
管材 料 和 水 管 位 置 是 定性 变量 . 

用 于 描述 、 分 析 数 据 的 合适 的 统计 工具 是 依赖 于 数据 类 型 的 . 因此 , 区 别 定量 数据 和 定性 数据 
是 很 重要 的 . 
应 用 练习 1.10 ”新西兰 灭绝 的 岛 类 .加利福尼亚 大 学 ( 河 滨 分 
1.9 饮用 水 质量 研究 ，Disasters (28 $, 2004 年 ) 发 BE) 的 环境 工程 师 正在 研究 新 西 兰 鸟 类 总 体 中 灭绝 


表 了 一 篇 关于 热带 旋风 对 一 个 偏远 的 太平 洋 岛 由 的 模型 . ( Evolutionary Ecology Research , 2003. 7. ) F 


给 出 了 每 个 l 地 ( 即 欧洲 人 到 达 之 
上 饮用 水 质量 影响 的 研究 , 收集 了 在 旋风 亚 美 天 击 。。 DIL LLL payaa SIE 
这 个 岛屿 后 大 约 4 个 星期 的 水 样本 (大 小 为 " = SHISA. 确定 每 个 变 
BTS A ^ 量 是 定量 的 还 是 定性 的 . 


SOO mL). 对 每 个 水 样本 记录 了 下 面 的 变量 ,确定 。 飞行 能 力 (会 飞 的 或 不 能 飞 的 


每 个 变量 是 定量 的 还 是 定性 的 ， b. 栖息 地 类 型 (水 栖 、 地 面 陆 栖 或 者 空中 陆 栖 ). 
a 收集 样本 的 城镇 c， 筑 梨 地 点 (地 面 、 地 里 的 窝 、 树 地 上 的 富 )， 

b. 供水 的 类 型 (内 陆 河 、 溪 、 地 泉 ). d. 梨 密度 (高 或 低 ). 

e. 酸度 (PH f, 1 ~14). e. 食物 ( 鱼 、 冰 椎 动物 或 者 无 脊椎 动物 ). 

d. 混浊 程度 ( 比 浊 法 浊 度 单位 = NTUs). f HEREC). 

e ECC). g， 蛋 的 长 度 (mm). 

£. 每 100 mL 水 里 大 肠 杆 菌 个 数 . h. 灭绝 状态 (灭绝 、 从 岛 上 迁 出 、 没 有 灭绝 ). 

gs， 游离 氮 的 残留 量 ( mg/L). 1.11 计算 机 电源 系统 负载 电流 ， 参考 练习 1.5 中 
h 是 否 有 硫化 氨 ( 有 或 没有 ). IEEE Transactions on Industry Applications( 1990 年 7/8 





O 数据 类 型 的 更 细致 的 划分 是 名 义 、 次 序 、 区 间 和 比率 数据 , 名 义 数据 是 定性 数据 ， 其 类 型 不 能 进行 有 意义 的 排序 . 次 
序数 据 也 是 定性 数据 , 但 是 存在 一 个 从 高 到 低 的 明显 的 分 组 等 级 . 区 间 和 比率 数据 是 两 种 不 同类 型 的 定量 数据 . 对 于 
大 多 数 统计 应 用 (以 及 在 此 序言 中 的 所 有 方法 ) , 将 数据 分 为 定量 的 和 定性 的 已 经 足够 了 . 
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月 ) 计 算 机 电源 系统 负载 流量 的 调查 . 除了 记录 中 性 和 孔 钻探 依赖 于 钻 悄 的 良好 排出 . 曾经 有 人 做 过 试验 ， 
线 电流 对 满 负 和 载 电 流 的 比例 , 研究 者 也 记录 了 负载 研究 当 发 生 钻 层 充 塞 时 深 孔 钻探 的 性 能 (Jorvrnal of 
的 类 型 ( 线 - 线 或 者 线 - 中 性 线 ) 以 及 计算 机 系统 卖 Engineering for Industry, 1993.5). 下 面 描述 了 钻探 过 
主 . 对 记录 的 每 个 变量 确定 数据 类 型 . 程 中 的 一 些 重要 变量 , 确定 每 个 变量 的 类 型 . 
.12 肺癌 的 CT dad. 已 经 开发 了 一 种 新 型 的 肺癌 a. 钻 悄 排出 速度 (每 分 钟 排出 的 钻 眉 ). 
扫描 技术 一 一 计算 机 XX 线 断 层 摄影 术 (CT). 医学 家 b. 钻探 深度 (mm). 

认为 CT 扫描 在 查找 小 肿瘤 方面 比 常规 的 X 射线 更 c. hAIRE (mms). 

敏感 . 南 佛罗里达 大 学 的 H. Lee Moffitt 癌症 中 心 正 d. 钻探 的 类 型 ( 单 边 、BTA 或 者 推 顶 ) 

在 进行 全 国 范围 的 一 个 50 000 名 吸烟 者 的 临床 试 e. 孔 表 面 的 质量 . 

验 , 以 比较 CT 扫描 和 X 射线 对 检测 肺癌 的 有 效 性 . .14 美国 国家 桥梁 目录 . 联邦 公路 局 (FHWA) 定 
(Todays? Tomorrows, 2002 Fk. ) 每 个 参加 试验 的 期 检查 美国 所 有 桥梁 的 结构 缺陷 ， FHWA 调查 的 
吸烟 者 被 随机 分 配 到 两 种 拍摄 方法 一 一 CT 或 者 X 数据 编 人 国家 桥梁 目录 (NBI). 下 面 列 出 的 是 由 
射线 中 的 一 种 , 并 且 随 时 记录 他 们 的 发 展 状况 . 除 NBI 维护 的 大 约 100 个 变量 中 的 几 个 . 确定 每 个 变 
了 所 用 的 拍摄 方法 外 , 临床 学 者 还 记录 了 每 名 吸烟 量 是 定量 的 还 是 定性 的 . 


一 


一 


者 第 一 次 用 分 配 的 拍摄 方法 检测 到 肿瘤 的 年 龄 a. 最 大 跨度 (ft). 

a 确定 本 次 研究 的 试验 单位 . b. 车 道 数 目 . 

b. 确定 每 个 试验 单位 度量 的 两 个 变量 . c. 桥梁 是 否 征 税 (是 或 否 ). 
c. 确定 度量 变量 的 类 型 (定量 的 或 者 定性 的 ). d. 平均 日 交通 量 . 

d. 根据 临床 试验 , 最 终 将 得 到 什么 样 的 推 斯 ? e. 桥 面条 件 ( 好 、 很 好 或 差 ). 


1.13 深 孔 钻探 .“ 深 孔 "钻探 是 当 孔 的 深度 与 孔 的 直 f 绕 行 公路 或 便道 的 长 度 (mile). 
径 之 比 超过 10 时 采用 的 一 类 钻探 作业 过 程 . 成 功 的 深 e 公路 类 型 ( 州 际 、 美 国 、 州 、 乡 村 或 城市 的 ) . 


1.4 ”统计 学 在 批判 性 思考 中 的 作用 


工程 与 科学 中 的 试验 研究 一 般 都 牵涉 到 利用 试验 数据 (样本 ) 推 断 某 个 概念 性 总 体 的 性 质 , 而 这 
个 概念 性 的 总 体 刻画 了 试验 者 感 兴趣 的 现象 . 这 个 推断 过 程 是 科学 方法 的 一 个 组 成 部 分 . 基于 试验 
数据 的 推断 首先 用 来 提出 有 关 现 象 的 理论 , 然后 利用 另外 的 样本 数据 来 检验 这 个 理论 . 

统计 科学 对 这 个 过 程 是 怎样 发 挥 作用 的 ? 为 了 回答 这 个 问题 , 我 们 必须 注意 基于 样本 数据 的 扒 
断 几乎 都 是 有 误差 的 , 因为 样本 不 能 提供 总 体 精确 的 映像 . 样本 提供 的 信息 特征 依赖 于 选取 的 特定 
样本 ,因此 不 同样 本 得 到 的 信息 是 不 一 样 的 . 例如 , 假定 你 想 估计 美国 石化 工厂 中 , 所 有 应 力 腐蚀 破 
裂 而 导致 合金 钢 损 坏 的 比例 . 你 调查 了 一 个 100 个 合金 钢 损坏 的 样本 的 原因 , 发 现 47 个 是 应 力 腐蚀 
破裂 导致 的 . 这 是 否 意味 着 在 石化 工厂 中 所 有 合金 钢 损 坏 都 精确 地 有 47% 是 应 力 腐蚀 破裂 造成 的 
呢 ? 显然 不 是 . 假定 你 不 知道 合金 钢 损 坏 应 力 腐蚀 破裂 的 真实 百分比 是 44% . 100 个 损坏 的 样本 可 能 
有 47 个 是 应 力 腐蚀 破裂 导致 的 ,而 另 一 个 100 个 损坏 的 样本 中 可 能 只 有 42 个. 因此, 基于 样本 的 推 
断 具 有 不 确定 性 . 

另 一 方面 , 假定 一 个 石化 工厂 曾经 有 一 次 合金 钢 损 坏 率 为 81%. 当 给 定 样本 损坏 率 为 47% 时 ， 
这 是 否 是 一 个 非常 高 的 损坏 率 呢 ? 统计 理论 用 概率 来 度量 关于 推断 的 不 确定 性 . 这 使 得 工程 师 和 科 
学 家 有 能 力 在 有 关 总 体 的 特殊 假定 下 , 计算 观测 到 的 特殊 样本 或 者 数据 测量 值 的 概率 . 这 些 概率 用 
来 评估 关于 样本 推断 的 不 确定 性 . 例如 , 在 给 定 的 样本 信息 下 , 我 们 可 以 通过 计算 观测 到 如 此 高 比 
例 的 机 会 , 来 确定 工厂 81% 的 合金 钢 损 坏 率 是 否 非常 高 . 

因此 , 统计 学 的 主要 贡献 是 , 使 得 工程 师 和 科学 家 能 够 用 已 知 的 可 靠 性 度量 作出 推断 (关于 日 
标 总 体 的 估计 以 及 决策 ). 这 样 工程 师 可 以 根据 数据 作出 明智 的 决策 与 推断 ， 即 统计 学 帮助 工程 师 批 
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判 地 思考 他 们 的 结论 . 
定义 1. 11 统计 思想 包括 应 用 理性 思维 和 统计 科学 来 批判 地 评估 数据 及 推断 . 


1.5 本 书 介绍 的 统计 方法 导 引 

虽然 我 们 给 出 了 一 些 探索 和 描述 数据 集 的 有 用 方法 (第 2 章 ), 但 是 本 书 及 现代 统计 学 主要 强调 
的 是 在 推断 统计 学 的 领域 . 图 1. 1 的 流程 图 给 出 了 本 书 各 章 的 轮廓 , 并 且 可 以 作为 选择 统计 方法 的 
指南 . 















两 个 比率 


7.10 节 和 
8.12 节 

















第 14 章 及 
15.5 节 、 





图 1.1 本 书 中 描述 的 统计 方法 流程 图 


# 论 





快速 回顾 


本 章 总 结 提 示 
e 统计 应 用 的 两 种 类 型 : 描述 和 推断 . 


e 统计 学 的 基本 要 素 : 总 体 、 试 验 单位 、 变 量 、 样 本 、 推 断 、 可 靠 性 度量 .， 


° 描述 性 统计 涉及 概括 以 及 描述 数据 集 . 
° 推断 性 统计 涉及 利用 样本 对 总 体 作 推 断 . 
e 数据 的 两 种 类 型 : 定量 和 定性 . 


补充 练习 


1. 


1. 


-i 


ek 


15 计算 机 系统 的 可 靠 性 . 计算 机 系统 的 可 靠 性 
是 以 一 个 指定 的 硬件 (如 硬盘 驱动 器 ) 的 寿命 来 度 
BS. 为 了 估计 某 个 系统 的 可 靠 性 , 试验 100 个 计 
算 机 元 件 , 直到 它们 失效 , 并 记录 它们 的 寿命 . 

a. 感 兴趣 的 总 体 是 什么 ? 

b. 样本 是 什么 ? — 

c. 数据 是 定量 的 还 是 定性 的 ? 

d. 如何 利用 样本 信息 估计 计算 机 系统 的 可 靠 性 ? 
16 迁徙 的 小 海龟 . 许 许 多 多 的 小 海鱼 本 能 地 跟 
着 共有 的 亮光 ， 穿 过 佛罗里达 的 沿海 公路 徘徊 于 
死亡 边缘 (Tampa Tribune, 1990 4E. 9 H 16 H). 这 
个 事件 促使 研究 者 开始 用 特殊 的 低压 钠灯 做 实验 . 
一 天 晚上 , 在 黑暗 的 海边 , 释放 了 60 只 小 海龟 , 记 
录 它 们 爬行 的 方向 . 第 二 天 晚上 , 装 上 特殊 的 灯 ， 
释放 同样 的 60 只 小 海龟 . 最 后 , 在 第 三 天 晚上 , 将 
油 秸 放 在 钠灯 上 面 . 在 三 个 实验 条 件 ( 黑 暗 、 钠 灯 
以 及 覆盖 上 油 秸 的 钠灯 ) 下 , 记录 了 每 只 海龟 的 假 
行 方向 . 

a. 确定 研究 者 感 兴趣 的 总 体 . 

b. 确定 样本 . 

c. 收集 的 是 什么 类 型 的 数据 , 定量 的 还 是 定性 的 ? 


.17 酸 的 中 和 实验 . 一 位 化 学 工程 师 做 了 一 个 实 


验 来 确定 为 中 和 2 mL 新 开发 的 清洁 溶液 所 需 盐酸 
的 量 . 化 学 家 准备 了 5 份 2 mL 的 溶液 , 并 往 每 份 溶 
液 加 入 已 知 浓度 的 盐酸 . 对 5 份 中 的 每 一 份 , 确定 
达到 中 和 溶液 所 必需 的 盐酸 量 . 

a. 对 此 项 研究 , 确定 试验 单位 . 

b， 确 定 度 量 的 变量 . 

e. 描述 化 学 工程 师 感 兴趣 的 总 体 . 

d. 描述 样本 . 


.18 土壤 中 的 PCB. 为 得 到 英国 土壤 样本 中 有 毒 


物质 多 氯 化 联 葵 (PCB) 的 含量 ,执行 一 个 初步 研究 
以 获得 相关 的 信息 (Chemosphere, 1986 年 2 月 ). 对 


1. 


_ 


一 


所 取 的 每 个 土壤 样本 , 研究 者 记录 了 位 置 (乡村 或 
城市 ) 及 PCB 含量 (g/kg 土 ). 确定 度量 的 变量 是 定 
量 的 还 是 定性 的 . 

19 工科 学 生 的 智力 开发 ， 对 宾夕法尼亚 州 的 工 
科大 学 生 应 用 佩 里 (Perry ) 的 智力 开发 模型 ( Journal 
of Engineering Education, 2005 年 1 月 ). 对 第 一 年 
的 项 目 设计 课程 , 记录 了 21 名 学 生 的 佩 里 得 分 
OK 1-5). GE: MERD 1 表示 智力 开发 的 最 低 
KE, 佩 里 得 分 5 表示 最 高 水 平 . )21 名 学 生 的 平 
均 佩 里 得 分 为 3. 27. 

a. 确定 该 项 研究 的 试验 单位 . 

b 感 兴趣 的 总 体 是 什么 , 样本 是 什么 ? 

c. 收集 的 数据 是 什么 类 型 的 , 定量 的 还 是 定性 的 ? 
d. 利用 样本 信息 对 总 体 作出 推断 . 


.20 数据 类 型 . 说 明 下 面 各 个 数据 集 是 定量 的 还 是 


定性 的 . 

16 个 地 震 反 射 波 的 到 达 时 间 . 

b. 在 数据 库 管 理 系 统 中 所 用 的 计算 机 软件 的 类 型 . 
校园 内 100 名 工科 学 生 使 用 的 计算 器 商标 . 

从 三 个 不 同 矿井 开采 的 煤 块 中 所 含 的 煤 灰 量 . 
12 辆 以 酒精 为 动力 的 汽车 行使 的 英里 数 . 

20 台 行 式 打印 机 在 每 个 计算 机 输出 行 中 打印 的 
字符 数 . 

g 某 航空 公司 负责 计算 机 操作 的 轮班 的 管理 人 员 . 
h. 46 个 机 械 厂 的 事故 率 . 


P 


> e e ° 


.21 有 结构 缺陷 的 桥梁 . 参看 练习 1. 14， 分 析 最 


近 的 NBI 数据 , 结果 刊登 在 Journal of Infrastructure 
Systems( 1995 年 6 月 ). 利用 FHWA 检查 等 级 , X 
国 的 470 515 条 立交 桥 分 为 有 结构 缺陷 的 、 功 能 过 
时 的 或 者 安全 的 . 有 大 概 26% 的 桥 被 发 现 是 有 结构 
缺陷 的 , 19% 是 功能 过 时 的 . 

a. 研究 者 感 兴趣 的 变量 是 什么 ? 

b. a 中 的 变量 是 定量 的 还 是 定性 的 ? 

c. 分 析 的 数据 集 是 总 体 还 是 样本 ? 说 明 原 因 . 

d. 研究 者 是 怎样 获得 研究 数据 的 ? 





活动 中 的 统计 学 : 田纳西 河中 鱼 的 污染 一 一 收集 数据 

化 学 工厂 以 及 制造 工厂 经 常 向 附近 的 河流 与 溪流 中 排放 有 毒 的 废物 ， 这些 有 毒物 质 对 于 生存 在 
河流 中 以 及 河 边 的 动 植物 有 负面 影响 . 一 种 通常 称 作 DDT 的 污染 物质 对 鱼 特别 有 害 , 对 人 类 也 有 间 
接 的 影响 . 食品 和 药物 管理 局 规定 一 条 鱼 中 DDT 含量 的 限量 为 百 万 分 之 五 (ppm) ,如果 食用 了 DDT 
含量 超过 这 个 限制 的 鱼 , 就 认为 对 人 体 有 潜在 的 危害 . 一 项 研究 是 检测 生活 在 田纳西 河 ( 位 于 亚 拉巴 
马 ) 及 其 支流 中 的 鱼 类 的 DDT 含量 . 

田纳西 河 以 东西 方向 流 经 亚 拉巴 马 北部 , 途经 惠 勒 水 库 一 一 国家 野生 动物 保护 区 . 生态 学 家 担 
心 污染 的 鱼 从 河流 入 口 回 游 到 水 库 , 可 能 威胁 到 以 鱼 为 食物 的 其 他 野生 动物 . 这 个 担心 并 不 是 空谈 . 
在 流 经 印第安 克 里 克 人 居住 区 支流 旁边 曾经 有 一 座 工厂 , 支流 从 河 库 人 口 321 mile( 英 里 ) 的 上 游 流 
人 田纳西 河 . 虽然 这 个 工厂 已 经 停产 10 多 年 , 但 是 有 证 据 表明 工厂 向 支流 中 排放 的 有 毒物 质 污 染 了 
相 邻 区 域 的 所 有 鱼 类 . 田纳西 河 及 其 支流 中 的 鱼 类 是 否 也 被 污染 了 呢 ? 如 果 是 这 样 , 污染 的 鱼 向 上 
游 回 游 了 多 远 ? 为 了 回答 这 些 以 及 其 他 问题 ， 美国 陆军 工兵 部 队 的 成 员 们 在 田纳西 河 以 及 三 条 支 
流 ; Flint 支流 (从 河 库 口 309 mile 的 上 游 流 入 田纳西 河 ) 、Limestone 支流 (从 河 库 口 310 mile) 以 及 
Spring 支流 (从 河 库 口 282 mile 上 游 流入 田纳西 ) 的 不 同 地 方 收 集 了 鱼 的 样本 . 每 条 鱼 首先 称 体 重 
(8), 量 长 度 (cm), 然后 把 鱼 切 成 片 , 测量 鱼 片 的 DDT 浓度 ( 百 万 分 之 一 ). 

DDT 文件 一 共 包 含 144 条 鱼 的 长 度 、 重 量 以 及 DDT 含量 的 样品 . 显然 , 不 是 捕捞 了 田纳西 河 及 
其 支流 中 的 所 有 鱼 . 所 以 数据 是 基于 生存 在 田纳西 河 所 有 鱼 类 的 总 体 中 收集 的 一 个 样本 . 这 里 ,总 体 
和 样本 用 来 描述 度量 的 对 象 , 即 鱼 . 我 们 也 可 以 用 专业 术语 描述 数据 集 . 例如 , 144 个 DDT 测量 值 表 
示 从 生活 在 这 条 河流 中 所 有 鱼 类 的 DDT 测量 值 组 成 的 总 体 中 收集 的 一 个 样本 . 

除了 定量 的 变量 长 度 、 重 量 以 及 DDT 浓度 外 , 注意 到 ， 数据 集 也 含有 定性 的 变量 位 置 ( 即 捕 鱼 
的 位 置 ) 以 及 鱼 的 种 类 的 信息 . 调查 三 种 鱼 类 : 海峡 铃 鱼 、 大 嘴 鲈 鱼 以 及 小 口 胭脂 鱼 . 不 同 的 位 置 符 
号 解释 如 下 . 前 两 个 字符 代表 河流 或 支流 ， 其 他 字符 代表 从 河流 或 支流 到 河 库 口 处 的 距离 (mile). 例 
如 , FCM5 表示 鱼 在 Flint 支流 (FC) , 从 河 库 口 上 游 5 mile( M5) 处 捕 提 . 类 似 地 ，TRM380 表示 来 自 于 
田纳西 河 (TR) , 距离 河 库 口上 游 380 mile( M380) 处 的 鱼 的 样本 . 

美国 陆军 工兵 部 队 利 用 DDT 文件 中 的 数据 ,比较 不 同位 置 以 及 不 同 种 类 的 鱼 的 DDT 含量 , 并 确 
定 长 度 和 重量 与 DDT 含量 的 关系 (如 果 存 在 ). 在 后 面 的 章节 中 , 我 们 将 会 在 例题 练习 以 及 活动 中 
的 统计 学 中 演示 其 中 的 某 些 分 析 . 
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目标 给 出 探索 、 概括 以 及 描述 数据 的 图 形 法 和 数值 法 ， 


2.1 描述 定性 数据 的 图 形 法 和 数值 法 


假定 你 已 经 收集 了 一 个 感 兴趣 的 数据 集 ， 如 何 弄 清楚 它 的 意义 ?也 就 是 说 , 如 何 去 整 理 、 总 结 
这 个 数据 集 , 使 得 它 比较 容易 理解 、 有 意义 ? 在 这 一 章 里 , 我 们 给 出 几 种 描述 数据 的 基本 统计 工具 ， 
包含 可 以 快速 给 出 数据 直观 形象 的 图 表 和 描述 数据 某 种 性 质 的 数值 量度 . 恰当 的 用 法 依赖 于 我 们 想 
要 描述 的 数据 类 型 (定量 的 或 定性 的 ). 

在 描述 定性 观测 值 时 , 我 们 以 这 样 一 种 方式 来 定义 类 : 每 个 观测 值 能 落 入 一 类 并 且 只 能 落 入 一 
类 (或 组 ). 然后 给 出 落 入 每 一 类 的 观测 值 个 数 或 相对 于 观测 值 总 数 的 比例 , 用 这 种 数值 方法 来 描述 
数据 集合 . 

定义 2.1 对 给 定 的 类 , 类 (或 组 ) 频数 是 指 落 入 这 个 类 中 的 观测 值 的 个 数 . 

定义 2.2 对 给 定 的 类 , 类 (或 组 ) 相 对 频率 是 指 落 入 这 个 类 中 的 观测 值 个 数 相对 于 观测 值 总 数 
的 比例 . 

为 了 说 明 这 两 个 概念 , 考虑 一 个 调查 核 动力 反应 堆 安全 和 使 用 能 源 的 危险 的 研究 人 员 感 兴趣 的 
问题 . 研究 人 员 发 现 自 1977 年 以 来 , 全 世界 有 45 起 表 2. 1 与 能 源 有 关 的 死亡 事故 原因 的 





与 能 源 有 关 导 致 多 人 死亡 的 事故 , 表 2. 1 汇总 了 研究 相对 频率 汇总 表 

人 员 的 调查 结果 . 在 这 个 应 用 中 , 感 兴趣 的 定性 变量 ERD ERE ARFER 

是 与 能 源 有 关 的 死亡 事故 的 原因 . 由 表 2.1 可 以 看 rm 7 0.156 

到 , 45 起 事故 数据 分 为 6 类 (原因 ) , 汇总 表 给 出 了 每 sem 4 0. 089 

类 原因 的 频数 和 相对 频率 . 很 明显 , 煤气 爆炸 是 最 可 d P 5 > 

能 引起 事故 的 原因 ,在 45 起 事故 中 出 现 了 28 次 ( 约 Oye ， 0.0 

占 62%). 燃油 火灾 4 0. 089 
定性 数据 的 图 形 描述 常用 条 形 图 或 饼 图 , 它们 由 “总 计 45 1.000 





计算 机 做 出 . 条 形 图 给 出 相应 每 一 类 的 频数 (或 相对 资料 来 源 : “Safety of nuclear power reactors” , Nuclear Is- 
BUR) , 长 方形 的 高 度 或 长 度 与 类 频数 (或 相对 频率 ) — sue Briefing Paper 14, 2004 年 11 月 . 
成 比例 . 饼 图 把 一 个 整 圆 ( 饼 ) 分 成 几 份 , 每 一 份 代表 一 个 类 , 每 份 中 心 角 与 类 相对 频率 成 比例 . 图 
2.1 和 图 2. 2 是 两 种 常见 图 形 法 的 示例 . 
图 2 1 是 由 MINITAB 产生 的 垂直 条 形 图 (条 形 图 可 以 是 垂直 的 , 也 可 以 是 水 平 的 ), 描述 了 表 2.1 
的 数据 . 每 个 长 方形 相当 于 6 个 原因 中 的 一 个 , 长 方形 的 高 度 与 落 人 这 类 原因 的 死亡 事故 数 成 比例 . 
2004 年 , 北美 大 约 有 144 000 个 工业 机 器 人 在 运行 . 图 2.2 是 一 个 MINITAB 饼 图 , 给 出 了 指派 不 
同 任务 的 工业 机 器 人 的 百分比 . 6 类 任务 是 (1) 点 焊 ; (2) 焊 弧 ; (3) 原料 切除 ; (4) 原料 处 理 ; (5) 
组 装 ; (6) 分 发 / 涂 层 . 饼 图 中 的 一 份 代表 一 个 类 , 一 份 的 大 小 与 类 的 相对 频率 (百分比 ) 成 比例 . DE 
图 不 仅 给 出 了 指派 到 每 个 任务 的 新 型 工业 机 器 人 的 精确 百分比 ,而 且 也 提供 了 相对 频率 的 快速 直观 比 
较 . 你 能 清楚 地 看 到 原料 处 理 (34% ) 和 点 焊 (32% ) 是 使 用 新 型 工业 机 器 人 的 两 类 主要 任务 . 
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机 器 人 任务 的 饼 图 


事故 原因 图 s @ 
























ë E mm m E| sse | 
溃 坝 煤气 爆炸 ”内 电 核反应 燃油 火灾 原材料 处 理 
原因 34.0% 
图 2.1 与 能 源 有 关 的 死亡 事故 原因 的 图 2.2 工业 机 器 人 应 用 的 MINITAB 饼 图 
MINITAB 条 形 图 资料 来 源 :美国 机 器 人 工业 协会 


本 以 将 如 图 2. 1 的 垂直 条 形 图 重新 安排 长 方形 在 图 上 的 顺序 形成 帕 雷 托 图 . 帕 雷 托 图 ( 以 意大利 
经 济 学 家 Vilfredo Pareto £ 命名 ) 是 一 个 频数 条 形 50" ITEN 
图 , 按 长 方形 的 高 度 顺序 排列 , 最 高 的 在 左边 . 帕 
雷 托 图 是 在 过 程 和 质量 控制 中 常用 的 一 种 图 形 工 1 
具 , 其 中 长 方形 的 高 通常 表示 生产 过 程 中 问题 
(如 缺陷 、 事 故 、 故 障 和 失效 ) 的 频数 . 因为 长 方 w 
形 是 按照 高 度 降序 排列 , 所 以 容易 辨别 最 严重 问 S 
题 的 区 域 . 
图 2.3 给 出 了 表 2. 1 中 汇总 的 与 能 源 有 关 的 
事故 数据 的 SPSS 帕 雷 托 图 , 因为 6 类 原因 的 相对 








频率 以 降序 排列 ,所 以 容易 判定 大 部 分 事故 的 原 o 4 M BEN = 
因 ( 煤 气 爆炸 ) 除了 长 方形 高 度 降 序 排列 ， 帕 雷 PUE HE Hel uon Hun 闪电 
托 图 也 给 出 了 事故 的 累积 比例 图 ( 称 “ 累 积 " 线 ) , 


添加 在 条 形 上 方 ， 累积 线 的 刻度 在 帆 雷 托 图 的 右 。。 四 2 3 与 能 源 有 关 的 死亡 事故 原 因 的 

边 显示 , 见 图 2.3. SESS SUAE 

LEENI 国家 冰雪 数据 中 心 ( NSIDC) 收集 了 加 拿 大 北极 圈 冰 融化 池 反 照 率 、 深 度 和 物理 性 质 的 数 
据 . 科罗拉多 大 学 的 环境 工程 师 利 用 这 些 数据 研究 气候 是 如 何 影响 海洋 冰 的 . 位 于 加 拿 大 北极 圈 的 
巴 罗 海峡 的 504 个 冰 融 化 池 数 据 保存 在 PONDICE 文件 中 , 感 兴趣 的 变量 是 每 个 池 观 测 到 的 冰 类 型 . 
冰 的 类 型 分 为 第 一 年 冰 、 多 年 冰 或 定 着 冰 . 为 了 描述 504 个 融化 池 冰 的 类 型 ,给 出 一 个 汇总 表 和 水 平 
条 形 图 , 并 解释 这 个 结果 . 

解 用 SAS 分析 PONDICE 文件 中 的 数据 . 图 2.4 给 出 了 三 种 类 型 冰 的 SAS 汇总 表 , 在 504 个 冰 
融化 池 中 ,88 个 是 一 年 冰 , 220 个 是 多 年 冰 , 196 个 是 定 着 冰 . 相应 的 比例 (或 相对 频率 ) 是 88/504 = 
0.175. 220/504 =0. 437 和 196/504 =0. 389, 这 些 比例 见 表 中 的 “百分比 ” 一 栏 及 图 2. 4 中 相应 的 SAS 
KERER. 科罗拉多 大 学 的 研究 员 们 利用 这 些 信息 估计 ， 在 加 拿 大 北极 圈 大 约 有 17% BO KR N 
是 第 一 年 冰 . 
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The FREQ Procedure 


Cunulative Cunulative 
ICETYPE Frequency Percent Frequency Percent 
First-year 88 17.46 88 17.46 
Landfast 196 38.89 284 56.35 
Multi-year 220 43.65 504 100.00 





Tp ni aaae a D a n hi i a 


0 1o 20 30 40 50 


百分比 
图 2.4 冰 融 化 池 中 冰 类 型 的 SAS 分 析 





定性 数据 的 图 形 描 述 法 总 结 | 
条 形 图 : 用 长 方形 表示 定性 变量 的 类 (组 ), 其 中 每 一 长 方形 的 高 是 类 频数 、 类 相对 频率 或 者 类 百分比 . 
饼 图 : 用 一 个 饼 ( 圆 ) 的 一 份 表示 定性 变量 的 类 (组 ), 每 份 大 小 与 类 相对 频率 成 比例 . 
帕 雷 托 图 : 将 定性 变量 ( 即 长 方形 ) 的 类 (组 ) 按 照 高 度 从 左 向 右 降序 排列 的 条 形 图 . 

















应 用 练习 饼 图 . 用 饼 图 汇总 下 表 中 的 数据 , 并 解释 结果 . 
2.1 工学 博士 学 位 . 下 表 给 出 了 从 1999 年 至 2003 你 的 工作 能 反映 你 在 学 校 学 习 的 工程 学 | 百分比 
年 美国 大 学 获得 工学 博士 学 位 的 人 数 和 注册 的 全 PRESS 
日 制 博士 生 人 数 . 根据 美国 工程 教育 学 会 的 资料 ， RE. 和 我 的 工作 紧密 联系 2 
B “1999 年 获得 博士 学 位 的 人 数 保持 平稳 ”, 但 “ 注 不 能 . 是 工程 学 , 但 不 是 我 所 学 的 32 
册 的 工学 博士 人 数 在 同期 却 显著 增加 ”. 用 条 形 图 工作 和 工程 学 无 关 9 
支持 此 观点 . 目前 失业 30 
”年 。 博 上 学 位 人 数 注册 博 十 生 ( 全 日 制 ) 资料 来 源 ， Mechanical Engineering, 2004 年 11 H, Vol. 
1999 5 945 31 536 I8, Ha. Lk 
2000 5 990 33 312 2.3 海滩 侵蚀 的 热 区 . 相对 于 周围 的 海滩 , 把 高 侵 
"x DM Pies 蚀 率 的 海滩 定义 为 侵蚀 热 区 . 美国 陆军 工兵 部 队 用 
在 线 问卷 调查 的 形式 作 了 一 项 关于 海滩 侵蚀 热 区 
bi TRES Te 的 研究 . 在 2002 年 初 , 搜集 了 6 Rn 
2003 5 870 45 462 息 某 些 数据 列 在 表 中 . 
资料 来 源 : 美国 工程 教育 学 会 , 2004 年 10 H. a 确定 每 个 记录 的 变量 是 定量 的 还 是 定性 的 . 


个 m — 4 
2.2 与 学 习 有 关 的 工程 工作 . Mechanical Engineering ei Gad In 
杂志 每 月 都 刊登 读者 问卷 调查 结果 . 2004 年 11 d. 用 饼 图 推断 全 国 所 有 海 浴 热 区 , 并 评述 它 的 可 
月 刊登 了 以 下 问题 的 调查 结果 ， “你 的 工作 能 反 靠 性 . 
映 你 在 学 校 学 习 的 工程 学 课程 吗 ?” 数 据 汇总 为 
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12 
、 、 近 滨 堤坝 ”长 期 腐蚀 
WEAR 。 海滩 条 件 条件， ORNA 
. ， 没有 沙丘 / 单一 , 海岸 
Miami Beach, FL 平坦 平行 线 4 
Coney Island, NY ed 其 他 13 
Surfside, CA 峭壁 /陡坡 x Bm 35 
Monmouth 单一 沙丘 平面 没 估计 
Beach, NJ 
Ocean City, NJ 单一 沙丘 其 他 没 估计 
Spring Lake, NY 没 观 测 平面 14 





资料 来 源 :“ Identification and characterization of erosional 
hotspots" , William & Mary Virginia Institute of Marine Sci- 
ence , U. S. Army Corps of Engineers Project Report, March 18, 
2002. 


-4 管理 系统 失 获 . 美国 化 学 安全 与 危险 调查 局 


(CSB) 负 责 查 明 工业 事故 的 根本 原因 . H 1998 年 
CSB 建立 以 来 , 已 经 鉴定 了 83 起 事故 是 由 管理 系 
统 失效 引起 的 . (Process Safety Progress, 2004 年 12 
A) 下 面 的 表 给 出 了 83 起 事故 根本 原因 的 分 类 . 画 





出 数据 的 帕 雷 托 图 并 解释 图 形 . 

管理 系统 原因 分 类 事故 个 数 
工程 与 设计 27 
生产 与 实践 24 
管理 与 监测 22 
培训 与 交流 10 


总 数 83 
La 
资料 来 源 : Blair, A. S. “ Management system failures identi- 
fied in incidents investigated by the U. S. Chemical Safety and 


Hazard Investigation Board. ” Process Safety Progress, Vol. 
23, No. 4, Dec. 2004( 21). 


.5 HJ REUS. 计算 安全 协会 (CSI) 对 美 


国 公务 部 门 进 行 年 度 计算 机 犯罪 调查 . CSI 向 所 有 
美国 公司 和 政府 机 构 的 计算 机 安全 人 员 发 了 问卷 调 
查 . 2001 年 , 64% 的 被 调查 者 承认 在 这 一 年 他 们 公 
司 有 计算 机 系统 的 未 授权 使 用 .( Computer Security 
Issues & Trends, 2001 年 春天 ). 一 个 调查 问题 是 “如 
有 果 你 的 商业 网 站 遭遇 了 未 授权 使 用 , 攻击 来 自 公司 
内 部 还 是 外 部 ?” 对 两 个 调查 年 一 1999 年 (报道 了 
125 次 受 攻击 ) 和 2001 年 (报道 了 163 次 受 攻击 )， 
事实 上 经 历 了 未 授权 使 用 公务 网 站 的 回应 汇总 在 
K. 


a. 用 条 形 图 描述 1999 年 计算 机 未 授权 使 用 的 





来 源 . 
b. 用 条 形 图 描述 2001 年 计算 机 未 授权 使 用 的 
KR. 
c. 比较 这 两 年 的 结果 , 由 图 可 以 推断 出 什么 ? 
网 站 受 攻 击 1999 年 百分比 — 2001 年 百分比 
内 部 7 4 
外 部 38 47 
两 者 41 23 
不 知道 14 26 
总 数 100 100 


——————————M—ÉÉ ÉL 
资料 来 源 :“2001 CSI/FBI computer crime and security sur- 
vey. " Computer Security Issues & Trends, Vol. 7, No. 1, 
2001 年 春 . 


.6 PWB 顶级 制造 商 . Circuit World (Vol. 26, 2000) 


报道 了 世界 上 排名 前 61 位 的 印 制 线路 板 (PWB) 制 
造 商 . 这 些 印 制 线路 板 制 造 商 公司 的 名 称 、 产 地 国 
和 每 年 收入 ( 百 万 美元 ) 保 存在 PWB 文件 中 . FE 
给 出 了 前 10 个 观测 值 , 画 条 形 图 描述 前 61 位 顶级 
印 制 线路 板 制 造 商 的 产地 国 . 由 于 没有 原 产 地 位 于 
欧洲 的 公司 ,对 欧洲 PWB 工业 的 活力 存在 忧虑 . 





条 形 图 能 否 支 持 这 个 观点 ? 
顺序 公司 家 ”收入 
1 CMK 日 本 1085 
2 Viasystems 美国 980 
3 Ibiden 日 本 890 
4 Hadco 美国 665 
5 Nippon Mektron 日 本 660 
6 Hitachi Chemical Group 日 本 616 
7 Compeq Mfg 台湾 560 
8 Mitsubishi Gas Chem Group 日 本 530 
9 Shinko Electric 日 本 478 
10 Johnson Matthey 美国 405 


资料 来 源 ， Britton, P. “ Competitive PWB manufacturing; 
What is needed to Maintain a Viable Industry in Europe?” Cir- 
cuit World, Vol. 26, No. 3, 2000(3 1). 


.7 本 福 德 数字 法 则 . 根据 本 福 德 ( Benford) 法 则 ， 


在 随机 选取 数字 时 ,(1, 2,…, 9) 中 的 某 些 数字 作 
为 第 一 个 有 效 数 字 比 其 他 数字 更 可 能 出 现 . 例如 ， 
法 则 预测 数字 1 最 可 能 作为 第 一 个 数字 出 现 ( 占 
3096 ). American Scientist( 1998 年 7-~-8 月) 报道 了 
检验 本 福 德 法 则 的 一 项 研究 , 要求 743 个 大 学 一 年 
级 学 生 随机 写 出 一 个 6 位 数 , 下 表 记 录 了 每 个 数 的 
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第 一 个 有 效 数字 及 其 分 布 汇总 . 





第 一 个 数字 出 现 的 次 数 
1 109 
2 75 
3 77 
4 99 
5 72 
6 117 
7 89 
8 62 
9 43 
总 数 743 





资料 来 源 :; Hill, T. P. “The first digit phenomenon. " American 
Scientist, Vol. 86, No. 4, 7 —8, 1998, p.363. (图 5). 


a 用 帕 雷 托 图 描述 “随机 猜测 "数据 的 第 一 个 数字 . 
b. 这 个 图 支持 本 福 德 法 则 的 观点 吗 ? 请 给 出 解释 . 

.8 软件 缺陷 . PROMISE 软件 工程 库 收集 了 为 建立 
预测 软件 模型 研究 人 员 服 务 的 数据 集 , 保存 在 
SWEFECTS 文件 中 的 一 个 数据 集 包 含 了 498 个 软 
件 代码 模块 的 信息 . 对 每 一 个 模块 分 析 是 否 有 缺 
K, 如 果 含 有 缺陷 的 代码 ,， 记 为 “true”; WERE 
有 缺陷 的 代码 , 就 记 为 “false”. 打开 数据 文件 , Æ 
成 有 缺陷 变量 的 饼 图 . 利用 饼 图 说 明 有 缺陷 软件 代 
码 的 可 能 性 . 

.9 新 西 兰 灭绝 的 岛 类 . 参考 练习 1.10, Evolution- 
ary Ecology Research ( 2003 年 7 月 ) 关 于 新 西 兰 灭绝 
的 鸟 类 类 型 的 研究 . 新 西 兰 在 毛利 殖民 地 时 期 有 关 
132 种 鸟 类 的 数据 保存 在 NZBIRDS 文件 中 ,数据 
是 关于 飞行 能 力 (会 飞 或 不 会 飞 )、 栖息 地 类 型 (水 
栖 、 地 面 陆 栖 、 或 空中 陆 栖 ) 、 筑 巢 地 点 (地 面 、 地 
里 的 窝 、 树 、 地 上 的 窝 )、 梨 密度 (高 或 低 ) 、 食物 
( 鱼 、 痊 椎 动物 、 植 物 或 者 无 峭 椎 动物 ) 、 身 体质 量 


(g)、 和 蛋 的 长 度 (mm) 和 灭绝 状态 (灭绝 、 从 岛 上 于 
出 、 没 有 灭绝 ). 用 图 形 法 研究 灭绝 状态 与 飞行 能 
力 、 栖 息 地 和 筑 梨 密度 相关 的 理论 . 


.10 地 下 并 水 的 污染 . 在 新 罕 布什 尔 州 大 约 一 半 


的 县 要 求 重新 控制 汽油 的 使 用 , 它 导致 了 地 下 水 
污染 中 甲 基 叔 丁 基 醚 ( MTBE) 的 增加 . Environmen- 
tal Science & Technology(2005 年 2 月) 报道 了 新 罕 
布什 尔 州 公用 和 私 用 井 与 MTBE 污染 有 关 的 一 些 
因素 , 搜集 了 一 个 223 口 井 的 样本 , 这些 数 据 保 
存在 MTBE 文件 中 . 三 个 变量 本 质 上 是 定性 变量 : 
井 的 类 型 (公用 或 私 用 ) 、 地 下 水 含水 层 ( 基 上 峙 或 
松散 的 ) 和 MTBE 的 检测 水 平 ( 低 于 限度 或 检 出 ). 
(È: 若 MTBE 值 超 过 0.2 ug/L, 则 出 现 MTBE 的 
EEKE. ) 下 表 给 出 了 选择 的 10 口 井 的 数据 , 对 
所 有 223 口 井 , 用 图 形 法 描述 三 个 定性 变量 中 的 


每 一 个 . 








井 的 类 型 含水 层 检测 的 MTBE 

私 用 Es] 低 于 限度 

私 用 Ea 低 于 限度 

公用 松散 的 检 出 

公用 松散 的 低 于 限度 

公用 松散 的 低 于 限度 

公用 松散 的 低 于 限度 

公用 松散 的 检 出 

公用 松散 的 低 于 限度 

公用 松散 的 低 于 限度 

4H HA 检 出 

公用 基 岩 检 出 
资料 来 源 : Ayotte, J. D. , Argue, D. M. , and McGary, F. 
J. , "Methyl tert-butyl ether occurrence and related factors in 


public and private wells in southeast New Hampshire. ” Environ- 
mental Science & Technology. Vol. 39, No. 1, Jan. 2005. 


2.2 描述 定量 数据 的 图 形 法 


回顾 1. 3 35, 定量 数据 集 是 由 某 种 有 意义 的 数值 标 度 的 数据 组 成 . 为 了 描述 、 总 结 和 检测 这 些 数 
据 的 模型 ,我们 可 以 采用 三 种 图 形 法 : 点 图 、 茎 叶 图 和 直方 图 . 因为 大 多 数 统计 软件 包 可 以 作 这 些 
图 , 所 以 这 里 我 们 重点 是 解释 这 些 图 而 不 是 作 图 . 

例如 , 美国 环保 署 (EPA) 要 对 所 有 的 新 车 模型 进行 广泛 测试 , 来 确定 它 的 行车 里 程 的 等 级 . 假设 
表 2 2 的 100 个 测量 值 表示 对 某 新 车 模型 测试 结果 , 我 们 如 何 汇总 这 个 大 样本 中 的 信息 呢 ? 
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表 2.2 100 辆 车 的 EPA 行车 里 程 等 级 


36.3 41.0 36. 9 37.1 44.9 36.8 30.0 37.2 42.1 36.7 
32.7 37.3 41.2 36.6 32.9 36.5 33.2 37.4 37.5 33.6 
40.5 36.5 37.6 33.9 40.2 36.4 37.7 37.7 40.0 34.2 
36.2 37.9 36.0 37.9 35.9 38.2 38.3 35.7 35.6 35.1 
38.5 39.0 35.5 34.8 38.6 39.4 35.3 34.4 38.8 39.7 
36.3 36.8 32.5 36.4 40. 5 36.6 36.1 38.2 38.4 39.3 
41.0 31.8 37.3 33.1 37.0 37.6 37.0 38.7 39.0 35.8 
37.0 37.2 40.7 37.4 37.1 37.8 35.9 35.6 36.7 34.5 
37.1 40.3 36.7 37.0 33.9 40.1 38.0 35.2 34.8 39.5 
39.9 36.9 32.9 33.8 39.8 34.0 36.8 35.0 38.1 36.9 





观察 这 些 数据 可 以 得 到 一 些 显 见 的 事实 . 例如 , 行车 里 程 大 多 在 30 £, 一 小 部 分 在 40 Z. 如 果 
不 求助 一 些 总 结 数据 的 方法 , 很 难 对 这 100 个 行车 里 程 等 级 提供 更 多 的 额外 信息 , 点 图 就 是 一 种 这 
样 的 方法 . 

点 图 

图 2.5 给 出 了 美国 环保 署 100 个 行车 里 程 等 级 的 MINITAB 点 图 , 图 2. 5 的 水 平 轴 表 示 定 量变 量 
每 加 仑 英里 (mpg) 的 刻度 . 数据 集中 每 次 测量 的 数值 用 位 于 水 平 轴 上 的 点 表示 ， 当 数据 重复 时 ,点 就 
放 在 另 一 点 之 上 , 在 各 数值 位 置 形成 一 个 柱 . 正如 你 所 看 到 的 , 这 个 点 图 证 实 了 几乎 所 有 行车 里 程 
等 级 都 在 30 以 上 , 大 部 分 在 35 ~40mpg 之 间 . 


MPG 的 点 图 











图 2.5 100 个 EPA 行车 里 程 等 级 的 MINITAB 点 图 


sent Bg 

对 于 这 些 相同 的 数据 , 另 一 种 图 形 表示 是 MINITAB gEREBB, 见 图 2. 6. 在 这 个 图 中 , 茎 是 测量 值 
(mpg) 小 数 点 左面 部 分 , 叶 是 剩 下 的 小 数 点 右边 部 分 . 

在 图 2. 6 中 , 数据 集 的 茎 从 最 小 (30) 到 最 大 (44) 列 在 第 二 栏 中 , 然后 每 一 观测 值 的 叶 列 在 相应 
观测 值 同一 行 的 右 侧 2. 例如 , 表 2. 2 中 第 一 个 观测 值 (36. 3) 的 叶 3 列 在 相应 茎 36 的 那 一 行 . 类 似 
地 , 表 2.2 中 第 二 个 观测 值 (32.7) 的 叶 7 列 在 相应 于 葵 32 的 那 一 行 , 第 三 个 观测 值 (40.5) 的 叶 5 列 
在 相应 于 茎 40 的 那 一 行 . (图 2. 6 强调 了 前 三 个 测量 值 的 茎 和 叶 ) 每 一 行 的 叶 基 本 上 如 MINITAB 2 
叶 图 所 显示 的 那样 ,是 有 顺序 排列 的 . 





O MINITAB 茎 叶 图 中 的 第 一 栏 表示 从 这 个 组 区 间 到 邻近 最 大 组 区 间 测量 值 的 累积 个 数 . 





N 











描述 性 统计 79 
CX) HE ”气候 * 氧 硫 / 氧 比例 
游船 名 称 公共 卫生 1 月 15 日 € 382 10.3 0. 270 
Volendam 97 IH Æ 286 6.9 0.241 
Voyager of the Seas 97 18 日 £X 302 6.2 0. 205 
Wind Spirit 97 DCH X 237 12.4 0. 523 
Wind Surf 98 20H Æ 6.3 (空气 样本 丢失 ) 一 
World Discoverer 89 20H B 741 45.8 0. 618 
资料 来 源 : 国家 环境 健康 中 心 、 疾 病 控制 和 防治 中 心 ， AH Æ 882 9.9 9.112 
2004 4 5 H 24 R. 21H Hë 464 27.4 0. 591 
22H Æ 135.9 44.8 0. 330 
a. 画 出 数据 的 茎 叶 图 , 并 指出 图 中 的 茎 和 叶 . 23 日 X 10.9 27 8 0.270 
b. HÆ Ef YEA 3k D EK UA B| ERE B e AR 23H H 289 6.5 0.225 
比例 . 25 日 X 469 11.2 0. 239 
c. 在 荃 叶 图 上 标 出 检查 分 数 为 74 分 的 位 置 ( Nauti- 25H 晴 443 16.6 0.375 


lus Explorer). 


.16 管道 表面 的 粗糙 度 . 为 了 防止 管道 腐蚀 ,油田 


管道 内 部 涂 有 覆盖 物 . 路 易 斯 安 那 大 学 的 工程 师 
Lafayette 调查 了 涂 层 对 油田 管道 表层 粗粮 度 的 影响 
( Anti-corrosion Methods and Materials, Vol. 50, 
2003). 扫描 探测 器 测量 了 20 节 内 部 有 涂 层 的 管道 
表面 粗糙 度 , 下 表 给 出 了 数据 (um). 用 恰当 图 形 
描述 样本 数据 . 

1.72 2.50 2.16 2.13 1.06 2.24 2.31 2.03 1.09 1.40 
2.57 2.64 1.26 2.05 1.19 2.13 1.27 1.51 2.41 1.95 








资料 来 源 : Farshad, F. and Pesacreta, T. " Coated pipe inte- 
rior surface roughness as measured by three scanning probe in- 
struments. " Anti-corrosion Methods and Materials, Vol. 50, 
No. 1, 2003( XE II). 
17 地 下 并 水 的 污染 . 参考 练习 2. 10, Environmen- 
tal Science & Technology(2005 年 1 月 ) 中 223 口 新 罕 
布什 尔 州 的 井 MTBE 污染 有 关 因 素 文章 . 数据 保存 
在 MTBE 文件 中 , 其 中 两 个 定量 变量 度量 了 每 一 口 
井 的 pH 值 (标准 单位 ) 和 MTBE 水 平 (pg/L). 
a. 画 出 抽样 井 pH 值 的 直方 图 , 由 直方 图 估计 pH 
值 小 于 7.0 的 井 的 比例 . 
b， 对 那些 可 检 出 MTBE 水 平 的 井 , 画 出 MTBE 值 
的 直方 图 . 由 直方 图 估计 MTBE 值 超过 5 pg/L 
的 污染 井 的 比例 . 
18 .果树 上 的 杀 忠 剂 . 参考 练习 1.3 , Environmental 
Science & Technology 关于 将 杀 虫 剂 用 于 加 利 福 尼 亚 
州 圣 华 金 河谷 休眠 果树 的 文章 . 在 喷 酒 浓度 最 大 时 
期 , 每 天 收集 并 分 析 果 树林 周围 空气 的 样本 . 下 表 
记录 了 空气 样本 中 硫 和 氧 的 浓度 (ngjms ) RA 
硫 比例 . 


N 





资料 来 源 : Selber, J. N. , 


idues of four organophosphate insecticides used on dormant or- 


et al. , ^ Air and fog deposition res- 


chards in the San Joaquin Valley, California. " Environmental 
Science & Technology , Vol. 27 , No. 10, Oct. 1993, p. 2240 (Æ V). 


a. 用 茎 叶 图 表示 每 天 硫 / 氧 比例 . 


b. 评价 陈述 * 杀 虫 剂 毒 死 昕 的 硫 / 氧 比例 , 睛 天 比 


ERA”. 


-19 不 断 生长 的 超 细 铜 微粒 . 印度 科学 家 在 玻璃 界 


面 上 作 了 关于 铜 微粒 生长 的 实验 ( Journal of Applied 
Physics, 1993 年 9 H). 在 玻璃 陶瓷 上 作 碱 / 铜 离子 
的 交换 反应 ,然后 用 氢气 作 还 原 处 理 ,干燥 后 ,从 
玻璃 表面 上 分 离 出 一 个 225 个 铜 微粒 的 样本 , 测量 
钢 微 粒 的 直径 ,并 用 相应 的 频数 直方 图 描述 . 

135 130 
120 
105 
90 


75 70 


微粒 的 数目 


60 


45 


5 
2 4 6 8 10 1 14 
直径 (nm) 


资料 来 源 ; Roy, B. and Chakravorty, D. “Ultrafine copper 
particles grown in a glass ceramic. "Journal of Applied 
Physics , Vol. 74, No. 6, Sept. 15, 1993, p. 4192( Ë 3). 
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行车 里 程 数据 的 组 区 间 、 频 数 和 相对 频率 2. 

对 区 间 34.5 ~36.0、36.0 ~37.5 和 37.5 ~39.0 的 相对 频率 求 和 ,可 以 看 到 65% 的 行车 里 程 数 
据 在 34.5 ~39.0 ZE. 类 似 地 , 仅 有 2% 的 汽车 行车 里 程 超 过 42.0. 通过 对 直方 图 和 相应 汇总 表 的 
进一步 分 析 , 可 以 得 到 许多 其 他 的 结论 . 注意 到 所 有 的 组 频数 之 和 总 是 等 于 样本 大 小 n. 对 于 较 小 数 
据 集 ,直方 图 区 间 个 数 选择 的 某 些 建议 见 下 面 的 方 框 . 








确定 直方 图 中 组 的 个 数 
数据 集中 观测 值 的 个 数 组 的 个 数 
少 于 25 5~6 
25~50 7~14 
多 于 50 15 ~20 











尽管 直方 图 提供 了 数据 集 很 好 的 直观 描述 , 特别 是 对 非常 大 的 数据 集合 , 但 是 它 不 能 为 我 们 指 
出 单个 测量 值 . 相反 , 从 某 种 程度 上 说 , 每 一 个 原始 测量 值 在 点 图 上 是 看 得 见 的 , 在 荃 叶 图 上 也 是 清 
晰 可 见 的 . 荆 叶 图 把 数据 按 升 序 排列 ,所 以 容易 确定 单个 测量 值 的 位 置 . 例如 , 由 图 2.6 我 们 容易 看 
到 , 有 两 辆 汽车 的 行车 里 程 测量 值 等 于 36. 3, 却 不 能 由 观察 直方 图 2.7 得 到 这 个 事实 . 然而 , SERES 
对 于 非常 大 的 数据 集 不 便 使 用 , 非常 大 量 的 共和 叶 使 得 图 的 纵向 和 横向 大 小 变 得 繁重, 削弱 了 直观 
表示 的 效果 . 





构造 直方 图 的 步骤 

步骤 1 计算 数据 的 极 差 : 极 差 = 最 大 观测 值 “最 小 观测 值 

步骤 2 把 极 差分 成 5~20 个 等 间隔 的 组 ,组 数 是 任意 的 ， 如果 你 的 数据 少 , 组 就 分 得 少 些 ; 数据 
多 ,组 就 分 得 多 些 ( 见 前 面 方 框 中 的 经 验 法 则 ) ,就 会 有 较 好 的 图 形 措 述 . 最 小 ( 即 第 一 个 ) 组 界 应 当 比 最 
小 值 小 ,选择 适当 的 组 宽 ， 使 得 没有 观测 值 落 在 组 界 上 

步骤 3 对 每 一 组 , 数 出 落 入 这 一 组 的 观测 信 个 数 ， 这 个 数 称 为 组 频数 . 

步骤 4 计算 每 一 组 相对 频率 组 相对 频率 uA CE: 

步骤 5 直方 图 本 质 上 是 条 形 图 ， 其 中 类 型 就 是 组 . 在 频数 直方 图 中 ,长 方形 的 高 度 由 组 频数 确 
Z. 类 似 地 ， 在 相对 频率 直方 图 中 ,长 方形 的 高 度 由 组 相对 频率 确定 














EE Rono: 文件 中 包含 了 在 日 本 搜集 的 390 种 铁 矿 石 样品 中 铁 含 量 的 百分比 数据 . 图 2.8 
是 用 SAS 产生 的 390 种 铁 矿石 测量 值 的 相对 频率 直方 图 

a. 解释 这 个 图 . 

b， 从 直观 上 估计 铁 矿石 测量 值 在 64. 6 ~ 65. 8 之 间 的 百分数 

解 

a， 注 意图 2. 8 的 SAS 直方 图 , 组 在 水 平 轴 上 是 以 间隔 0. 4 划分 的 , 标记 出 的 是 每 个 区 间 的 中 点 
(而 不 是 下 界 和 上 界 ). 直方 图 表明 铁 矿石 的 百分比 测量 值 在 66 附近 趋 于 最 大 ,也 就 是 说 , 65.8 - 





O 与 许多 软件 包 一 样 ， 当 观测 值 落 在 组 区 间 的 边界 上 时 , SPSS 就 把 它 划分 到 下 一 个 最 大 的 区 间 . 例如 , 行车 里 程 37. 5 落 、 
在 组 区 间 36.0 ~37.5 和 37.5 ~39.0 HRE, 把 它 划 分 到 37.5 ~39.0 KE. 3 2.3 中 的 频数 反映 了 这 个 约定 . 
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茎 叶 图 是 数据 集 的 另 一 个 压缩 图 , 你 一 眼 就 可 看 出 100 个 行车 里 程 数据 分 布 在 30.0 - 44.9 之 


E, 其 中 大 部 分 落 在 茎 35 -39 的 行 上 . 2525 34 的 那 行 上 的 6 
个 叶 表 示 100 个 数 中 有 6 个 等 于 或 大 于 34. 0 而 小 于 35.0. 
类 似 地 , 11 个 叶 在 茎 为 35 的 行 上 , 表示 100 个 数据 中 有 11 
个 等 于 或 大 于 35.0 而 小 于 36.0. 只 有 5 辆 车 行车 里 程 数 据 
等 于 或 大 于 41, 并 且 只 有 一 个 低 到 30. 





构造 荃 叶 图 的 步骤 
步骤 1 把 数据 集中 的 每 一 观测 值 分 为 莹 和 叶 两 部 分 . 例如 ， 
行车 里 程 31.8 的 茎 和 叶 分 别 为 31 # 8. 
4 | nr 
31[ 8 


步骤 2 将 茎 依次 排 成 一 列 ， 从 最 小 的 茎 开始 到 最 大 的 茎 
结束 . 
步骤 3 处 理 整个 数据 集 , 把 每 一 观测 值 的 叶 放 在 恰当 的 


行 上 . 你 可 能 希望 把 同一 行 上 的 叶 按 升序 排列 . 


直方 图 














Stem-and-leaf of MPG N = 100 
Leaf Unit - 0.10 


T 30 0 
2 31 8 
6 32 5799 
12 33 126899 
18 34 024588 
28 35 01235667899 
49 36 01233445566777888999 
(21) 37  000011122334456677899 
30 38 0122345678 
20 39 00345789 
12 40 0123557 
5 41 002 
42 1 


44 9 





图 2.6 100 个 行车 里 程 等 级 的 
MINITAB ŻA 


图 2.7 给 出 了 美国 环保 署 100 个 行车 里 程 数据 的 SPSS 直方 图 . 图 2.7 的 水 平 轴 表 示 某 辆 汽车 每 
MERR, MEKE 30.0 ~31. Smpg( 英 里 /加 仑 ) 开 始 , 按 等 长 区 间 ,直至 43.5 ~45.0 mpg， 分 成 了 多 
个 组 区 间 . 纵 轴 表 示 100 个 数据 中 落 人 每 个 区 间 的 个 数 (或 频数 ). 如 图 2.7 所 示 , 100 辆 汽车 中 大 约 
有 33 辆 或 33% 的 汽车 行车 里 程 在 36. 0 ~37. 5 之 间 , 这 个 组 区 间 的 频数 最 大 ， 随 着 行车 里 程 数 减 小 


REK, 区 间 包 含 的 观测 值 的 个 数 也 减 小 . 


直方 图 可 用 于 描述 落 在 每 个 组 区 间 上 观测 值 的 频数 或 相对 频率 . 表 2.3 汇总 了 美国 环保 署 汽 车 





R23 汽车 行车 里 程 数据 的 组 区 间 、 
频数 和 相对 频率 

" 组 区 间 HS 数 相对 频率 
30.0 ~31.5 1 0.01 
= 31.5-33.0 5 0. 05 
* 20 33.0 -34.5 9 0. 09 
34.5 ~36. 0 14 0. 14 
36. 0 ~37.5 33 0. 33 
10 37.5 ~39.0 18 0.18 
39.0 ~40.5 12 0. 12 
40.5 -42. 0 6 0. 06 
0 42.0 ~43.5 1 0.01 
300 315 330 345 36.0 375 390 405 420 435 45.0 43.5 -45.0 1 0. 01 

MPG 

图 2.7 100 个 EPA 行车 里 程 等 级 的 SPSS 直方 图 2y zs 
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. 画 出 这 9 7-30 EE FEL E n ES. 

， 画 出 这 9 个 测量 值 的 直方 图 . 

a~c 中 的 三 个 图 , 哪 一 个 信息 量 较 大 ? 

. 放射 性 程度 在 -5. 00 或 更 低 的 测量 值 的 比例 是 

多 少 ? 

.12. 小 行星 的 谱 像 . 麻 省 理工 学 院 (MIT) 的 研究 人 
员 研 究 了 直径 小 于 10 km 的 主 带 小 行星 的 光谱 
性 质 . 

在 MIT 观测 站 用 希 特 纳 望 远 镜 观测 小 行星 ， 
并 且 记录 每 次 观测 的 独立 谱 像 曝光 个 数 N. 由 Sci- 
ence(1993 年 4 月 9 日 ) 得 到 的 40 个 小 行星 观测 的 
数据 列 在 下 面 . 


agp c 


N 





== N U + 


CEU EL MR ILE NO RUE ML MC WERE p 
资料 来 源 : Binzel, R. P. , and Xu, S. "Chips off of Asteroid 4 
Vesta; Evidence for the parent body of basaltic achondrite mete- 
orites. " Science. Vol. 260, Apr. 3, 1993, p. 187( 31). 


a. 用 茎 叶 图 汇总 数据 . 
b. 恰好 有 一 个 谱 像 曝光 的 小 行星 的 观测 比例 . 


. 13 地震 余 震 的 震级 . 地 震 学 家 用 术语 余震 描述 一 
个 主 震 之 后 的 小 地 震 . 1994 年 1 月 17 A Northridge 
发 生地 震 后 , 洛杉矶 地 区 在 3 个 星期 内 又 经 历 了 
2 929 次 余震 . 美国 地 质 调查 所 记录 了 这 些 余震 的 震 
级 (里 氏 震 级 ), 并 保存 在 EARTHQUAKE 文件 中 . 
下 面 给 出 了 这 些 震 级 的 MINITAB 相对 频率 直方 图 . 
a. 估计 2 929 次 余震 中 里 氏 震 级 在 1.5 ~2.5 之 间 

的 百分比 . 
b. 估计 2 929 次 余震 中 里 氏 震 级 超过 3.0 的 百 
分 比 . 


N 


震级 图 


20. 




















级 


练习 2. 13 的 MINITAB 输出 


2.14 生产 过 程 中 电压 读数 . Harris 公司 /佛罗里达 


N 


大 学 着 手 研究 在 偏远 地 方 完成 的 制造 过 程 能 否 在 
本 地 建立 . 检测 设备 (控制 器 ) 安装 在 新 老 两 个 地 
方 , 并 获得 生产 过 程 的 电压 读数 . 电压 读数 至 少 为 
9.2 V 认为 是 一 个 “好 的 生产 过 程 ” (读数 大 比 读数 
小 好 ). 下 表 包 含 了 每 个 地 方 30 个 产品 运转 期 的 电 
压 读 数 . 











老 地 方 新 地 方 
9.98 10.12 9.84 h 9.19 10. 01 8.82 
10. 26 10.05 10.15 9. 63 8.82 8. 65 
10. 05 9.80 10.02 10. 10 9. 43 8.51 
10. 29 10. 15 9. 80 9. 70 10. 03 9.14 
10. 03 10.00 9.73 10. 09 9. 85 9.75 
8.05 9.87 10.01 9.60 9.27 8.78 
10.55 9: 55 9.98 10.05 8.83 9.35 
10.26 9.95 8.72 10.12 9.39 9.54 
9.97 9. 70 8. 80 9. 49 9.48 9. 36 
9. 87 8.72 9.84 9.37 9. 64 8. 68 


资料 来 源 : Harris Z1 8], Melbourne, FL. 


a. 画 出 老 地 方 生产 过 程 电压 读数 的 频率 直方 图 . 

b. 画 出 老 地 方 生产 过 程 电压 读数 的 茎 叶 图 , a 和 
中 的 两 个 图 哪个 信息 量 更 大 ? 

c 画 出 新 地 方 生产 过 程 电 压 读数 的 频率 直方 图 . 

d. 比较 a 和 中 的 两 个 图 (你 可 以 在 同一 个 图 中 画 
两 个 直方 图 )， 说 明 制 造 过 程 能 在 本 地 建立 吗 
( 即 新 老 两 个 地 方 生产 过 程 一 样 好 还 是 新 地 方 
生产 过 程 比 老 地 方 生产 过 程 更 好 )? 


-15 游船 公共 卫生 检查 . 为 了 减少 潜在 的 肠胃 疾病 


的 爆发 , 所 有 到 达 美 国 口岸 的 客 用 游船 都 要 进行 
公共 卫生 检查 . 疾病 控制 和 防治 中 心 把 船 的 卫生 等 
级 分 为 100 点 . 86 分 或 更 高 表示 这 艘 船 达到 了 公认 
的 卫生 标准 . 2004 年 5 H, 对 174 悉 游 船 公共 卫生 
评分 数据 保存 在 SHIPSANIT 文件 中 . 数据 集 的 前 5 





个 和 后 5 个 观测 值 列 在 下 表 | 
游船 名 称 公共 卫生 
Adonia 99 
Adventure of the Seas 97 
AIDAAura 99 
AIDAAvita 98 
Albatross 96 
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66. 2 这 组 有 最 大 的 相对 频率 . 
b. 在 64.6 ~65.8 之 间 的 长 方形 在 图 2. 8 中 用 阴影 表示 . 这 个 阴影 部 分 占 整 个 分 布 总 的 长 方形 面 
积 的 40% , 因此 , 390 种 铁 矿 石 测 量 值 中 大 约 有 40% 位 于 64.6 和 65. 8 之 间 . 


30: 


251 





62.8 63.2 63.6 64 644 64.8 652 656 66 664 66.8 
铁 矿 石 


图 2.8 铁 矿 石 数据 的 SAS 直方 图 


解释 相对 频率 分 布 

落 入 某 个 特定 区 间 中 测量 值 的 个 数 占 所 有 测量 值 个 数 的 百分比 与 在 相应 区 间 上 的 长 方形 面积 是 
成 比例 的 . 例如 , 在 某 个 分 布下 , 30% 的 面积 落 在 某 个 特定 区 间 上 , 那么 就 有 30% 的 观测 值 落 在 这 一 
范围 内 . 

大 多 数 软件 统计 包 可 以 产生 直方 图 、 茎 叶 图 和 点 图 , 这 三 种 图 都 是 用 图 形 描述 数据 的 有 用 工具 . 
我 们 建议 只 要 有 可 能 就 应 当 产 生 并 对 比 这 三 个 图 , 你 会 发 现 对 于 非常 大 的 数据 集 , 直方 图 一 般 会 更 
AAE, 而 对 于 较 小 的 数据 集 , 茎 叶 图 和 点 图 提供 了 有 用 的 细节 . 





定量 数据 图 形 描述 法 的 总 结 
点 图 : 数据 集中 每 一 个 定量 测量 的 数值 表示 为 水 平 刻 度 尺 上 的 一 个 点 ， 当 数值 重复 时 , 点 垂直 画 在 另 
一 点 之 上 . 
MHA: 定量 变量 的 数值 分 为 茎 和 叶 两 部 分 ， 可 能 的 茎 按 顺 序 排 在 一 列 中 , 数据 集中 每 一 定量 测量 值 


的 叶 放 在 相应 茎 的 行 上 ,有 相同 茎 的 观测 值 的 叶 在 水 平方 向 按 升 序 排列 . 

直方 图 : 定量 变量 的 可 能 数值 被 分 成 若干 组 区 间 ， 其 中 每 一 区 间 有 相同 的 宽度 , 这些 区 间 构 成 了 水 平 
轴 刻 度 . 确定 落 在 每 一 组 区 间 中 的 观测 值 的 频数 或 相对 频率 . 每 一 组 区 间 上 放 一 个 垂直 的 长 方形 , 它 的 高 度 
或 者 等 于 组 频数 或 者 等 于 组 相对 频率 . 











应 用 练习 CR; 数值 越 接近 于 0, 样品 中 饮 的 含量 越 大 . ) 
2. 11 放射 性 地 衣 . 对 原子 核 事故 泄漏 的 放射 物 ， 地 地 点 
衣 具 有 很 强 的 吸收 能 力 . 由 于 地 衣 是 阿拉 斯 加 驯鹿 Bethel -5.50  -5.00 
的 主要 食物 来 源 , 而 驯鹿 又 是 许多 阿拉 斯 加 村 民 Eagle Summit -4.15 -4.85 
的 主要 食物 来 源 , 因此 监测 地 衣 的 放射 性 程度 是 Moose Pass -6.05 I 
重要 的 . 阿拉 斯 加 大 学 的 研究 人 员 费 尔 班 克 斯 Turnagain Pass -5. 00 
( Fairbanks) 为 此 搜集 了 位 于 不 同 地 区 的 9 种 地 衣 „Wickersham: Hume -410 250 = 的 - 
样品 , 测量 了 每 一 样品 中 放射 性 元 素 饮 137 的 含量 资料 来 源 : 地 衣 放射 性 核 素 基准 研究 项 目 , 2003. 


( 微 居 里 /毫升 ). 数据 转化 为 对 数 后 列 于 表 中 . a. [Bi 3X 9 个 测量 值 的 点 图 . 











20 第 2 章 
a 大 约 有 多 少 钢 微 粒 的 直径 在 5 ~7 nm 之 间 ? 出 了 26 个 沉积 冰 厂 物 样 本 中 AVBe 的 比率 . 在 图 
b 将 频数 直方 图 转化 为 相对 频率 直方 图 . 形 帮 助 下 , 估计 ABe 比 超过 4.5 Bv EIFE dA B 
c、 直 径 超 过 9 nm 的 铜 微粒 大 致 比例 是 多 少 ? 比例 . 

2.20 ”估计 冰 砚 的 年 龄 . 冰 厂 物 就 是 含有 黏土 、 沙 、 3.75 4.05 3.81 3.23 3.13 3.30 3.21 
砾石 和 巨 砾 混合 物 的 冰 磺 . 为 了 估计 威斯康辛 州 冰 4.06 4.56 3.60 327 40 338 3.37 
奢 的 年 龄 , 华盛顿 大 学 地 球 和 空间 科学 系 的 工程 3.32 4.09 3.90 5.06 3.85 3.88 
师 研 究 了 沉积 冰 奢 物 的 化 学 组 成 (4merican Jour- 273 295 2.285 2.73 255 3.06 
nal of Science, 2005 年 1 H. ) 沉 积 物 中 元 素 铝 (Al) 资料 来 源 : 摘自 American Journal of Science, Vol. 305, No. 
和 皱 (Be) 的 比例 与 沉积 的 持续 期 间 有 关 . FRA 1, Jan. 2005, p. 16( 表 2). 


2.9 描述 定量 数据 的 数值 法 

数值 描述 性 度量 是 由 数据 集 计算 得 到 的 数值 , 帮助 我 们 在 脑海 中 建立 它 的 相对 频率 直方 图 的 印 
AR. 我 们 将 给 出 三 种 类 型 的 度量 : (1) 帮助 确定 相对 频率 分 布 中心 位 置 的 度量 ; (2) 围绕 中 心 波动 的 
度量 ; (3) 描述 数据 集中 一 个 观测 值 相对 位 置 的 度量 . 这 些 类 型 分 别称 作 中 心 趋势 度量 、 变 异 的 度量 
和 相对 位 置 的 度量 . 在 以 下 定义 中 , 我 们 将 用 符号 y 表示 产生 数据 集 的 观测 变量 , y, ys ,…, y, 表 
示 数 据 集 的 =” 个 测量 值 . 

由 样本 数据 计算 得 到 的 数值 描述 性 度量 通常 称 作 统 计量 . 相反 , 总体 的 数值 描述 性 度量 称 作 参 
数 , 它们 的 值 基本 上 是 未 知 的, 通常 用 希腊 字母 表示 . 例如 , 我 们 将 看 到 ,总体 平 均值 用 希腊 字母 
表示 . 虽然 如 果 我 们 能 实际 进入 整个 总 体 , 就 能 够 计算 这 个 参数 值 , 但 是 由 于 经 济 等 原因 ， 一 般 我 们 
避免 这 么 做 . 然而, 以 后 将 会 看 到 , 我 们 对 总 体 抽样 , 利用 样本 统计 量 推断 或 作出 关于 感 兴趣 的 总 体 
参数 值 的 决策 . 

定义 2.3 统计 量 是 由 样本 数据 计算 得 到 的 数值 描述 性 度量 . 

定义 2.4 参数 是 总 体 的 数值 描述 性 度量 . 


2.4 中心 趋 势 的 度量 

算术 平均 、 中 位 数 和 众 数 是 三 种 最 常用 的 中 心 趋势 度量 . 三 者 之 中 , 算术 平均 (通常 称 为 均值 ) 
是 实际 问题 中 使 用 最 频繁 的 . 

定义 2. 5 n AMEE Y, y2, ys 集合 的 算术 平均 是 测量 值 的 平均 值 : 


Yi 
] 


i= 





一 般 用 符号 y 表示 样本 均值 ( 即 n 个 测量 值 样本 的 平均 值 ), 而 希 腾 字 母 j 表示 总 体 均 值 . 
计算 n=5 个 样本 测量 值 的 均值 : 4, 6, 1,2, 3. 
# ” 代 人 7 了 的 公式 


_4+6+1+2+3 
. H 5 i 
XX 2.0 n AMEY, y,, o. y. 集合 的 中 位 数 是 测量 值 按 升序 (或 降序 ) 排 列 后 位 于 中 间 
的 那个 数 , 即 这 样 一 个 位 置 上 的 y 值 , 使 得 在 相对 频率 直方 图 中 一 半 的 面积 位 于 它 的 左边 ,一 半 的 





y = 3.2 
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面积 位 于 它 的 右边 . 我 们 用 符号 由 表示 样本 中 位 数 ， 符 号 了 表示 总 体 中 位 数 

若 一 个 数据 集中 测量 值 个 数 是 奇数 , 则 当 把 测量 值 按 升序 排列 时 , 中间 那 个 测量 值 就 是 中 位 数 
例如 , 在 例 2.3 中 , n=5 的 样本 观测 值 的 中 位 数 是 m =3. 若 测量 值 的 个 数 是 偶数 , 则 当 把 测量 值 按 
升序 排列 ,中 位 数 定义 为 中 间 两 个 测量 值 的 平均 . 例如 , n = 6 个 测量 值 1, 4, 5, 8, 10, 11 的 中 位 
数 是 





计算 小 样本 数据 集 的 中 位 数 
当 n 个 测量 值 的 样本 按 升序 排列 时 , 用 yo 表示 第 i 个 y 值 ， 则 样本 中 位 数 如 下 计算 : 
bs 若 nn 为 奇数 


十 yn + N . 
"ME IET. 














定义 2.7 n^AB € yy, y, 集合 的 众 数 是 以 最 大 频数 出 现 的 y 值 . 

如 果 从 一 块 三 合板 上 截 下 相对 频率 直方 图 的 轮 廊 ， 它 将 在 位 于 平均 值 的 那 一 点 保持 完全 平衡 ， 
如 图 2. 9a 所 示 . 定义 2. 6 提 到 在 相对 频率 直方 图 分 布 中 ， 一 半 面 积 位 于 中 位 数 的 左边 , 一 半 面 积 位 
于 中 位 数 的 右边 , 如 图 2. 9b 所 示 . 众 数 位 于 以 最 大 频数 出 现 的 点 ， 即 相对 频率 分 布 的 峰 , 如 图 2.9e 
所 示 . 


相对 频率 
相对 频率 











均值 (平衡 点 ) 众 数 ( 峰 点 ) 


c) 





图 2.9 解释 相对 频率 分 布 的 均值 、 中 位 数 和 众 数 


尽管 均值 是 比较 常用 的 中 心 趋势 的 度量 ， 但 是 它 对 非常 大 的 或 非常 小 的 观测 值 是 敏感 的 . 因此 
均值 将 移 向 偏 度 的 方向 ( 即 分 布 的 尾部 ) ， 有 些 情况 下 可 能 产生 误导 . 例如 ， 数据 集 由 土木 工程 毕业 生 
的 第 一 年 起 始 薪水 组 成 ， 几 个 毕业 生 的 高 起 始 薪水 将 对 均值 产生 比 对 中 位 数 更 大 的 影响 . 由 于 这 个 原 
央 ， 有 时 称 中 位 数 为 中 心 趋势 的 耐 托 性 度量 . 因为 与 均值 不 一 样 ， 它 不 受 极端 观测 值 的 影响 . 对 于 偏 度 
极 大 的 数据 集 ( 如 土木 工程 毕业 生 的 起 始 薪水 数据 ) ,中 位 数 能 较 好 地 措 述 数据 分 布 的 “中 心 ”. 

很 少 用 众 数 作为 中 心 趋势 的 度量 , 只 有 当 对 y 出 现 的 相对 频率 感 兴趣 时 ， 才 用 众 数 而 不 是 平均 
值 或 中 位 数 . 例如 , 一 个 木工 原料 供应 商 只 对 他 所 卖 钉 子 长 度 (in) 的 众 数 感 兴趣 . 

总 之 , 一 个 数据 集合 中 心 趋势 最 好 的 度量 依赖 于 你 描述 信息 的 类 型 . 本 书 所 讨论 的 大 部 分 推断 
性 统计 方法 , 在 理论 上 是 基于 数据 有 一 点 偏 度 或 没有 偏 度 的 丘 形 分 布 . 对 这 些 情况 , 均值 和 中 位 数 实 
际 上 是 相同 的 . 由 于 均值 比 中 位 数 具有 更 好 的 数学 性 质 ， 因此 在 这 些 推断 方法 中 , 常用 均值 作为 中 
心 趋势 的 度量 . 
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参考 例 2.2 与 390 种 铁 矿 石 样品 中 铁 含量 百分数 的 测量 值 ， 求 这 个 数据 集 的 平均 值 、 中 位 
数 和 众 数 : 并 解释 结果 . i i, PEUT TIUS Sala esie 

解 ” 由 于 这 个 数据 集 ( 存 在 IRONORE 文件 中 ) 很 大 , 我 们 用 
EXCEL 得 到 这 些 中 心 趋势 度量 . 图 2. 10 给 出 了 EXCEL 描述 性 统 
计量 输出 表 的 一 部 分 . 平均 值 、 中 位 数 和 众 数 (输出 中 着 重 标示 ) 
分 别 为 65. 74% 、65. 83% 和 65. 81% . 





平均 值 表明 铁 矿 石 样本 的 平均 含量 是 65. 7496 ; 中 位 数 表 
明 样 本 中 有 一 半 ( 或 195 ) 样 品 的 测量 值 低 于 65. 83% ; RAK 
明 样 本 中 铁 矿 石 含 量 出 现 最 多 的 是 65. 81%. 注意 , 当 这 三 个 
中 心 趋势 度量 同时 放 在 直方 图 (图 2.8) 上 时 ,就 是 对 数据 集 


“中 心 ” 的 很 好 描述 . 





图 2. 10 


铁 矿 石 含 量 测量 值 的 EXCEL 
描述 性 统计 量 
2.21 中 心 趋势 的 度量 . 求 下 列 数据 集 的 均值 、 中 位 RD 
a. 3 道 空 气 日 Y H. 
数 和 众 数 . 求 隧 道 空气 的 日 平均 氨 含 量 


a, 4,3,10,8, 5. 
b. 9,6, 12, 4,4,2, 5,6. 

2.22 放射 性 地 衣 . 参考 练习 2. 13, 阿拉 斯 加 大 学 监 
测 地 衣 所 含 放射 性 水 平 的 研究 . 9 个 地 衣 样 曲 中 放 
射 性 元 素 饮 - 137 的 含量 在 下 表 重 新 给 出 . 

地 点 


N 


N 


b. 求 氮 含 量 的 中 位 数 . 
c. 解释 a 和 b 中 得 到 的 值 . 


,25 生产 过 程 中 电压 读数 . 求 出 并 解释 练习 2. 14 


中 每 个 电压 读数 集合 的 均值 、 中 位 数 和 众 数 . 哪 一 
个 是 更 好 的 中 心 趋势 度量 ? 说 明 原 因 . 


.26 游船 公共 卫生 检查 . 参考 练习 2. 15, 疾病 控制 


中 心 关于 174 稻 国 际 游船 公共 卫生 水 平 的 研究 ( 公 


Bethel —5.50 - 5.00 

Eagle Summit -4.15 -4.85 共 卫 生 分 数 从 0 ~ 100). 求 出 并 解释 公共 卫生 水 平 
Moose Pass -6.05 中 心 趋势 的 数值 描述 性 度量 . 

Turnagain Pass —5.00 2.27 Jd ES X 338. 求 出 并 解释 练习 2.18 中 硫 / 
Wickersham Dome -4.10 -4.50 -4.60 氧 比例 数据 的 均值 、 中 位 数 和 众 数 . 哪 一 个 是 更 好 


资料 来 源 : Lichen Radionuclide Baseline Research Project , 
2003. 

a. 求 放射 性 水 平 的 均值 、 中 位 数 和 众 数 . 

b. 解释 a 中 每 一 个 中 心 趋势 度量 值 . 


.23 小 行星 的 谱 像 . 求 出 并 解释 练习 2. 12 中 小 行 
星 谱 像 曝 光 数 据 的 均值 、 中 位 数 和 众 数 . 哪 一 个 是 
更 好 的 中 心 趋 势 度量 ? 说 明 原 因 . 

2.24 汽车 排 气 中 的 氨 . 为 了 减少 汽车 排 气 中 释放 的 
污染 物 ， 新 汽车 中 安装 了 三 向 催化 转化 器 . 然而 ， 
这 些 转化 器 无 意 间 增加 了 空气 中 氨 的 含量 . Eni- 
ronmental Science & Technology(2000 年 9 月 1 日 ) 公 
布 了 一 项 关于 旧金山 高 速 公路 隧道 出 口 硬 道 附近 
氨 含 量 的 研究 . 表 中 的 数据 表示 该 年 夏天 随机 抽取 

+ 8 天, 每 天 下 午 高 峰 时 期 氨 的 浓度 ( 百 万 分 之 一 ). 


m 


N 


的 中 心 趋势 度量 ? 说 明 原因 . 


.28 蒙古 沙漠 中 的 蚂蚁 . Journal of Biogeography 


(2003 年 12 H) 发 表 了 一 篇 关于 蒙古 (中 亚 ) 蚂蚁 

首次 综合 研究 的 文章 . 植物 学 家 把 种 子 诱饵 放 在 11 

个 研究 地 点 , 观察 每 一 地 点 吸引 的 蚂蚁 种 类 . 表 中 

给 出 了 在 每 一 研究 地 点 记录 的 一 些 数 据 . 

a. 求 在 11 个 地 点 发 现 的 蚂蚁 种 类 数 的 均值 、 中 位 
数 和 众 数 . 解释 每 一 个 值 . 

b. 你 建议 采用 哪 一 个 中 心 趋势 度量 描述 蚂蚁 种 类 
数 分 布 的 中 心 ? 解释 . 

c. 求 在 5 个 干旱 草原 观测 点 的 植物 总 覆盖 率 均值 、 
中 位 数 和 众 数 . 

d. 求 在 6 个 戈壁 沙漠 观测 点 的 植物 总 覆盖 率 均值 、 
中 位 数 和 众 数 . 
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e 基于 c 和 4d 的 结果 , 两 类 区 域 植物 总 覆盖 率 分 布 的 中 心 是 否 不 同 ? 
地 点 区 域 年 降雨 量 (mm) 日 最 高 温度 (C) 植物 总 覆盖 率 蚂蚁 种 类 数 。” 种 类 多 样 性 指标 
1 干旱 草原 196 5.7 40 3 0.89 
2 十 旱 草原 196 5.7 52 3 0. 83 
3 干旱 草原 179 7.0 40 52 1.31 
4 干旱 草原 197 8.0 43 7 1.48 
5 干旱 草原 149 8.5 27 5 0. 97 
6 戈壁 沙滩 112 10.7 30 49 0. 46 
7 戈壁 沙滩 125 11.4 16 5 1. 23 
8 戈壁 沙滩 99 10.9 30 4 0.0 
9 戈壁 沙滩 125 11.4 56 4 0.76 
10 戈壁 沙滩 84 11.4 22 5 1.26 
11 戈壁 沙滩 115 11.4 14 4 0. 69 
资料 来 源 : Pfeiffer, M. , et al. , “ Community organization and species richness of ants in Mongolia along an ecological gradient from 


steppe to Gobi Desert. " Journal of Biogeography, Vol. 30, No. 12, Dec. 2003(3& 1 413€ 2). 


2. 


N 


29 眼睛 折射 的 研究 . 度量 眼睛 折射 情况 的 传统 方 
法 包括 三 个 定量 指标 : (1) 球 透 镜 的 放大 率 ; 
(2) 柱 透 镜 的 放大 率 ; (3) 轴 . 视力 检查 人 员 研 究 
了 折射 率 这 三 个 度量 的 变异 . ( Optometry and Vision 
Science, 1995 年 6 月 ) 对 100 个 大 学 生 进 行 眼睛 测 
试 获得 了 25 个 连续 的 折射 率 测量 值 . 某 位 学 生 ( ID 
#11) 左 眼 柱 透 镜 的 放大 率 的 测量 值 列 在 表 中 . 
(GE: 所 有 的 测量 值 都 是 负 值 . ) 

0.08 0.08 1.07 0.09 0.16 0.04 0.07 0.17 0.11 
0.06 0.12 0.17 0.20 0.12 0.17 0.09 0.07 0.16 
0.15 0.16 0.09 0.06 0.10 0.21 0.06 

资料 来 源 : Rubin, A. 


iation during autorefraction : Multivariate distribution of refrac- 


, and Harris, W. F. , “Refractive var- 


tive status. " Optometry and Vision Science, Vol. 72, No. 6, 

June 1995, p. 409( 3€ 4). 

a. 求 数 据 的 中 心 趋势 度量 , 并 解释 它们 的 值 . 

b. 注意 到 这 个 数据 集 包 含 一 个 相对 于 其 他 测量 值 
不 寻常 大 的 负 柱 透镜 的 放大 率 测量 值 , 找 出 这 个 
测量 值 . (在 2.7 节 中 我 们 称 这 个 值 为 异常 值 ). 

ce MEERDER b 中 的 异常 值 , 重新 计算 中 心 趋 
势 度量 . 蓟 除 异 常 值 对 哪 一 个 度量 影响 最 大 ? 


. 30 使 用 中 的 核电 厂 . 美国 能 源 情报 署 监控 美国 所 


有 的 核电 厂 的 运作 . 表 中 列 出 了 20 个 州 使 用 中 的 

核电 厂 个 数 . 

a. 求 这 个 数据 集 的 均值 、 中 位 数 和 众 数 . 

b， 剔 除数 据 集 中 的 最 大 值 , 重新 做 a. 噜 除 这 个 测 
量 值 后 对 a 中 中 心 趋势 有 什么 影响 ? 


c. 将 表 中 20 个 值 从 小 到 大 排序 ,然后 删 去 数据 集 
中 最 小 的 两 个 值 和 最 大 的 两 个 值 , 求 剩 下 数据 的 
平均 值 . 这 个 结果 称 为 10% 358,35 4& , 因为 它 是 
在 删 去 10% 的 最 大 值 和 10% 的 最 小 值 后 计算 而 
得 到 的 . 切 尾 均 值 比 通常 的 算术 平均 有 什么 
优点 ? 





JH 核电 厂 个 数 
Alabama 


Arizona 





x 


California 
Florida 
Georgia 


- 


= oU do tag — — — Ñ — G + Q dU 


Illinois 

Kansas 
Louisiana 
Massachusetts 
Mississippi 
New Hampshire 
New York 
North Carolina 
Ohio 
Pennsylvania 
South Carolina 
Tennessee 
Texas 
Vermont 


Wisconsin 3 
资料 来 源 : Statistical Abstract of the United States , 2000 ( 表 
966) . U. S. Energy Information Administration, Electric Power 


Annual. 
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2.5 变异 性 的 度量 
数据 变异 性 的 最 常用 度量 是 极 差 、 方 差 和 标准 差 . 
定义 2.8 极 差 等 于 一 个 数据 集合 中 最 大 测量 值 和 最 小 测量 值 的 差 : 
极 差 = 最 大 测量 值 - 最 小 测量 值 
定义 2.9 n 个 测量 值 yl, y,, cc, y, 的 样本 方差 定义 为 ; 
. . (X , 
， 26 -7)? 2 - =r >: -n(y) 


n-l n-1 n-li 


对 一 个 有 nn 个 测量 值 的 有 限 总 体 ， 总 体 方差 定义 为 ; 
2, Oi =a)? 








$ 


[^d 






n 
定义 2. 10 n 个 测量 值 的 样本 标准 差 等 于 方差 的 平方 根 : 
Y i -7)? 
s= Js? = [d 
n-1 


总 体 的 标准 差 为 oc = /o2. 
求 n=5 个 样本 观测 值 的 方差 和 标准 差 : 1, 3, 2, 2, 4. 


解 首先 计算 Y Y 
yl1+3+2+2+4=12 
Y» = (1)? + (3)? + (2)? + (2)? + (4)? = 34 
则 样本 方差 为 : 
(E 


n _ n 4 2 
Eo-»' y. S 3.2" 
2 _ ii = dil n 5 


n-1 n-1 = 4 =1.3 





S 


样本 标准 差 为 : 


s= s? = 1.3 =1. 1402 
两 个 不 同 数据 集 可 能 有 相同 的 极 差 , 但 有 很 不 相同 的 变异 性 . 因此 , 极 差 是 数据 变异 性 相对 不 
灵敏 的 度量 . 极 差 主要 用 于 工业 质量 控制 ， 其 中 推断 方法 是 基于 小 样本 情况 ( 即 小 的 4 值 ). 方差 有 理 
论 上 的 意义 , 但 是 难于 解释 ， 因为 对 感 兴趣 的 变量 y 的 度量 单位 是 平方 (如 in^ ppm? 等 ). 但 标准 差 
的 度量 单位 与 y 的 单位 相同 (如 种 、_ppm 等 ). 结合 数据 集 的 平均 值 ， 标准 差 容易 解释 . 
解释 标准 差 的 两 个 有 用 法 则 是 经 验 法 则 和 切 比 雪夫 ( Chebyshev ) 法 则 . 
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经 验 法 则 

若 一 个 数据 集 有 近似 丘 形 的 对 称 分 布 , 则 可 用 以 下 的 经 验 法 则 描述 数据 集 : 

1. 大 约 68% 的 测量 值 位 于 均值 的 1 个 标准 差 范围 内 ( 即 对 于 样本 在 区 间 y+s 范围 内 ， 对 玉 总 体 在 区 间 
u + 范围 内 ). 

2. KA 95% 的 测量 值 位 于 均值 的 2 个 标准 差 范围 内 ( 即 对 于 样本 在 区 间 了 +2s 范围 内 ， 对 于 总 体 在 区 
El u £2o 范围 内 ). 

3. 几乎 所 有 的 测量 值 位 于 均值 的 3 个 标准 差 范 围 内 ( 即 对 于 样本 在 区 间 了 +3s 范围 内 , 对 于 总 体 在 区 
间 人 +3e 范围 内 ). 











切 比 雪夫 法 则 

切 比 雪夫 法 则 可 用 于 任 一 数据 集 ， 无论 数据 的 频数 分 布 是 什么 形状 . 

a. 可能 有 很 少 的 测量 值 落 在 平均 值 的 1 个 标准 差 范围 内 ， 即 对 于 样本 在 区 间 (7+s) 范 围 内 ， 对 于 总 体 
EKN (a +o) % É] AR. 
b. 至 少 有 地 的 测量 信 落 在 平均 信 的 2 个 标准 差 范围 内 ， 即 对 于 样本 在 区 间 (y+2s) 范 围 内 , 对 于 总 体 
在 区 间 (jw+20) 范 围 内 . 
c, 至 少 有 -的 测量 值 位 于 均值 的 3 个 标准 差 范围 内 ， 即 对 于 样本 在 区 间 (7 寺 3s) 范围 内 ， 对 于 总 体 在 
El (u +30) % Él RN. 

d. 通常 , AFERAT LN k, 至 少 有 人 1 - 忘 ) 的 测量 值 落 在 平均 值 的 个 标准 差 范围 内 ， 即 对 于 样 
KERKE & ks) AEA, FEAE RN (u tko) HEN. 
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经 验 法 则 是 由 许多 领域 的 研究 者 通过 观察 许多 不 同类 型 的 真实 数据 集 而 得 到 的 实际 经 验 的 结 
R. 切 比 雪夫 法 则 是 由 俄国 数学 家 Pafnuty L.，Chebyshev(1821 一 1894) 证 明 的 . 方 框 中 描述 的 两 个 法 
则 给 出 了 一 个 数据 集落 人 区 间 y+ 中 测量 值 的 百分比 , 其 中 为 任意 整数 . 
参考 例 2. 4 和 铁 矿 石 样品 中 铁 含量 百分数 , 用 经 验 法 则 描述 铁 含 量 测量 值 的 分 布 , 特别 估 
YF 390 个 铁 矿 石 样品 中 铁 含量 测量 值 落 在 均值 的 2 个 标准 差 范围 内 的 个 数 . 

St 由 图 2.10 的 EXCEL 结果 输出 , 我 们 可 以 看 到 样本 均值 7= 65. 74%, REE s =0. 6995. 利 
用 这 些 值 , 我 们 构造 区 间 7 了 +s、 了 + 上 2s 和 7+35. 应 用 经 验 法 则 和 切 比 雪夫 法 则 , 估计 390 个 铁 含量 测 
量 值 落 人 这 些 区 间 的 比例 , 这 些 比例 在 表 2. 4 中 给 出 ， 

52.4 390 个 铁 矿 石 含 量 测 是 值 应 用 经 验 法 则 





k y ks 用 经 验 法 则 估计 的 期 望 百分比 ”用 切 比 雪夫 法 则 估计 的 期 望 百分比 实际 比例 
1 (65. 05,66. 43) 7«0. 68 至 少 为 0 0.744 
2 (64. 36,67. 12) 7-0. 95 至 少 为 0.75 0. 947 
3 (63. 67,67. 81) =1. 00 FD 7j 0. 889 0. 980 


你 可 以 看 到 , 对 于 这 三 个 区 间 中 的 每 一 个 , n 2390 个 铁 们 1 样本 中 铁 含量 测量 值 落 在 这 些 区 间 
的 实际 比例 与 经 验 法 则 的 近似 值 非常 接近 , 这 样 的 结果 是 预 基 的 , 因为 这 390 个 测量 值 的 相对 频率 
直方 图 ( 见 图 2.8) 是 丘 形 分 布 而 且 几 乎 对 称 . 尽管 切 比 雪夫 法 则 可 以 应 用 于 任何 一 个 数据 集 , 但 它 
是 趋 于 保守 的 , 给 出 的 是 落 在 区 间 内 测量 值 百分比 的 下 界 . 因此 , 落 在 均值 的 2 个 标准 差 范围 内 铁 含 、 
量 测 量 值 的 百分比 最 好 估计 是 由 经 验 法 则 得 到 的 一 一 大 约 95% . 
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在 工程 和 自然 科学 中 过 到 的 许多 数据 集 都 是 近似 丘 形 的 , 科学 家 经 常 应 用 经 验 法 则 去 估计 大 部 
分 测量 值 落 和 人 其 中 的 范围 , 基本 上 选择 区 间 y+2s, 因为 它 包 含 了 大 约 95% 的 数据 . 


应 用 练习 
"2. 31 汽车 排 气 中 的 氨 . 参考 练习 2.24, Enviromental 
Science & Technology(2000 年 9 H 1 日) 关于 旧金山 
高 速 公路 隧道 出 口 夏 道 附近 氨 含 量 的 文章 . 表 中 给 
出 了 8 个 下 午 高 峰 时 期 的 数据 ( 百 万 分 之 一 ). 


1.53 1.50 1.37 1.51 


. 求 氮 含 量 的 极 差 . 

. 求 氨 含 量 的 方差 ， 

. 求 氨 含 量 的 标准 差 . 

:假定 在 出 口 臣 道 处 每 天 早上 高 峰 期 氨 含 量 的 标 
准 差 为 1.45 ppm. 早上 或 下 午 哪 一 段 时 间 的 高 
峰 期 氨 含 量变 化 更 大 一 些 ? 

2.32 使 用 中 的 核电 厂 . 参考 练习 2. 30, 美国 能 源 情 
报 署 关于 20 个 州 使 用 中 的 核电 厂 个 数 , 数据 保存 
在 NUCLEAR 文件 中 . 

a. 求 这 个 数据 集 的 极 差 、 方 差 和 标准 差 . 
b， 从 数据 集中 剔除 最 大 值 后 , 再 做 a. 删 去 这 个 测 

量 值 对 a 中 变异 性 度量 有 什么 影响 ? 


1.55 1.42 1.41 1.48 


£0 Tp 


c. 从 数据 集中 剔除 最 大 值 和 最 小 值 ,再 做 a. 删 去 
这 两 个 测量 值 对 变异 性 度量 有 什么 影响 ? 

2. 33 香烟 中 的 尼 十 丁 含 量 . 美国 联邦 贸易 委员 会 
(FTC) 根 据 香 烟 中 焦油 、 尼 古 丁 和 一 氧化 砚 的 含量 ， 
定期 对 国内 香烟 品牌 分 级 . 用 连续 吸烟 机 “ 吸 ” 烟 ， 
直到 剩 下 一 个 23 mm 长 度 的 烟 蒂 , 测量 烟雾 的 残留 
“ 干 ”颗粒物 中 焦油 、 尼 古本 和 一 氧化 碳 的 含量 ( 售 
和 人 到 mg). FTC 近来 测试 了 500 种 品牌 香烟 中 尼 古 
THRE, 数据 保存 在 FTC 文件 中 . SAS 输出 描述 
尼古丁 的 分 布 . 

a. 检查 尼古丁 含量 的 相对 频率 直方 图 . 用 恰当 的 
经 验 法 则 描述 数据 集 . 

b. 在 输出 结果 中 找 出 尼古丁 含量 的 平均 值 和 标准 
差 , 并 计算 区 间 (y 25). 

c， 基 于 a 中 结果 , 估计 尼古丁 含量 落 在 b 中 区 间 
的 香烟 百分比 . 

d. 利用 SAS 直方 图 的 信息 确定 落 在 b 中 区 间 尼 十 
丁 含量 的 实际 百分比 . 你 的 回答 与 你 在 c rh fs 
计 的 结果 一 致 吗 ? 





dy 


The MEANS Procedure 


finalysis Variable 
Std Dev 


N Mean 


: NICOTINE 


Minimum Max imum 





500 0.8425000 


0.3455250 


0.0500000 1.9000000 





5&2] 2.33 的 SAS 输出 


2.94 软件 缺陷 . 参考 练习 2. 8 和 包含 498 个 软件 代 
码 模块 信息 的 PROMISE 软件 工程 库 数 据 集 . 代码 
模块 是 否 包含 缺陷 的 一 个 可 能 的 预测 是 代码 的 线 


数 . 下 面 的 MINITAB 输出 中 给 出 了 含有 缺陷 模块 
和 不 含 缺 陷 模 块 代码 线 数 的 概括 统计 量 . 用 均值 和 
标准 差 对 比 有 缺陷 (“true" ) 和 无 缺陷 (“false”) 模 
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块 代码 线 数 的 分 布 . 的 MTBE 水 平 概括 统计 量 . 

2.35 地 下 井 水 的 污染 , 参考 练习 2. 10, Enviromental a. 求 包含 新 罕 布 什 尔 州 私 用 井 大 部 分 MTBE 值 (大 
Science & Technology( 2005 年 1 月 ) 关 于 新 罕 布什 尔 约 95% ) 的 区 间 . 
州 井 的 MTBE 污染 的 文章 ,只 考虑 检测 到 MTBE Jf b. 求 包含 新 罕 布什 尔 州 公用 井 大 部 分 MTBE 值 (大 


2. 


N 


的 数据 . 下 表 的 MINITAB $i H 46 H Z: FHURURA JH 


24 95% ) 的 区 间 ， 





Descriptive Statistics: MLOC 











Variable defect N Mean StDev Minimum Q1 Median Q3 Maximum 
MLOC false 449 26.17 37.64 1.10 8.00 15.00 29.00 423.00 
true 49 61.51 67.49 1.00 21.00 41.00 285.50 411.00 
练习 2.34 的 MINITAB 输出 
Descriptive Statistics: MTBE-Level (WellClass = Private) 
Variable N Mean StDev Minimum Qi Median Q3 Maximum 
HTBE-Level 22 1.000 0.950 0.240 0.330 0.520 1.390 3.860 
Descriptive Statistics: MTBE-Level (WellClass = Public) 
Variable N Mean StDev Minimum Q1 Median Q3 Maximum 
MTBE-Level 48 4.56 10.39 0.230 0.353 1.04 3.07 48.10 








练习 2.35 的 MINITAB 输出 


36 ”监测 腿 部 运动 的 阻抗 性 . 在 监测 腿 部 运动 的 阻 
抗 性 实验 中 , 韩国 工程 师 把 电极 系 在 志愿 者 的 脚 中 
和 膝盖 上 . 感 兴趣 的 是 阻抗 变化 的 信 噪 比 (SNR ) , 
其 中 信号 是 指 腿 部 运动 的 强度 , 噪声 是 指 由 干扰 
(例如 , 脚 躁 弯曲 和 导 部 伸展 ) 造成 的 阻抗 变化 . 用 
某 个 脚 踩 - 膝盖 电极 对 ,得 到 了 10 个 志愿 者 的 
SNR fH, 均值 为 19. 5, 标准 差 为 4.7. (IEICE Trans- 
actions on Information and Systems, 2005 年 1 月 ) 假 
设 总 体 的 SNR 值 分 布 是 丘 形 、 对 称 的 . 给 出 一 个 大 
约 包含 总 体 的 95% SNR 值 的 区 间 . 你 是 否 期 望 观测 
到 一 个 SNR 值 为 30 的 数据 ? 

37 混凝土 FRP 条 的 承重 量 . 纤维 增强 聚合 物 
(FRP) 合 成 材料 是 加 强 、 改 造 和 修理 混凝土 结构 的 
标准 . 典型 的 是 将 FRP 条 用 环 氧 粘 合 剂 固定 在 混 凝 
+ F. 威斯康星 - 麦迪 撑 大 学 的 工程 师 发 明了 一 种 
用 机 械 贸 钉 固定 FRP 条 的 新 方法 . ( Composites Fab- 
rication Magazine , 2004 年 9 月 ) 为 了 评价 这 种 新 的 
固定 技术 , 10 种 拉 挤 FRP 条 用 机 械 方法 固定 在 高 
速 公路 桥 上 , 来 检验 它 的 承重 强度 . 表 中 给 出 了 承 
重 强度 的 测量 值 ( Mpa). 利用 样本 数据 给 出 一 个 可 


N 


N 


能 包含 拉 挤 FRP 条 承重 强度 的 区 间 . 

240. 9 248. 8 215.7 233.6 231.4 
230. 9 225.3 247.3 235.5 238.0 
资料 来 源 ; 数据 是 由 Composites Fabrication Magazine , Sept. 

2004, p. 32( 表 1) 提 供 的 信息 模拟 得 到 . 

.38 温 彻 斯 特 式 子弹 的 速度 . American Rifleman 
(1993 年 6 月 ) 报 道 了 关于 FEG POR 式 手 枪 发 射 的 
一 种 匈牙利 制造 的 9 mm 子弹 速度 . 野外 试验 表明 
手枪 发 射 的 温 彻 斯 特 式 子弹 的 平均 速度 (在 15 ñ) 
是 936 fs, 标准 差 是 10 ft/s. 也 用 乌 齐 和 黑山 式 子 
弹 做 试验 . 

a. 描述 从 FEG P9R 式 手枪 发 射 的 温 彻 斯 特 式 子弹 
速度 的 分 布 . 

b. J FEG POR 式 手 枪 发 射 了 一 颗 未 知 商标 的 子弹 . 
假设 这 颗 子弹 的 速度 (在 150.) E: 1 000 ft/s. 这 颗 
子弹 最 可 能 是 由 温 彻 斯 特制 造 的 吗 ? 说 明 原 因 . 

.99 来 自 星系 的 光速 . 天 文学 家 推断 冷 暗物质 
(CDM) 促 使 宇宙 中 星系 的 形成 和 星云 团 出 现 , 理 
论 上 CDM 模型 要 求 估 计 由 星云 团 释 放出 的 光速 . 
Astronomical Journal(1995 年 7 月) 发 表 了 一 篇 关于 
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观测 到 的 位 于 4 个 不 同 星云 团 光速 的 文章 , 星系 速 
度 是 由 光谱 摄像 仪 和 高 倍 望 远 镜 测量 的 ， 以 km/s 


度量 . 


a. 观测 到 位 于 A2142 星云 团 的 103 个 星系 的 速度 
汇总 在 下 面 的 直方 图 中 , 判定 经 验 法 则 是 否 适 
合 描述 这 个 星云 团 速度 的 分 布 . 


15 — 


= 
I 


星云 团 的 数目 





资料 来 源 ; Oegerle, W. R. , Hill, J. M. , 
“Observations of high dispersion clusters of galaxies : Constrain - 


bon cold dark matter. " The Astronomical Journal ,Vol. 110, 


A2142 速度 分 布 


Y 


MAYA 


j bsp 









No. 1 ,July 1995. p. 37( Ë 1). 


2.6 





n i 
E 4 | | | f 


25 30 
观测 到 的 速度 (1000 km/s) 





| 


and Fitchett, M. J. , 


b. 星云 团 A2142 中 观测 到 的 103 个 速度 的 平均 值 
和 标准 差分 别 为 X=27 117 km/s 和 s =1 280 km/ 
s. 利用 这 个 信息 构造 一 个 大 约 包含 这 个 星云 团 
95% 星系 速度 的 区 间 . 

c. 推荐 一 个 用 于 研究 星云 团 A2142 的 CDM 模型 的 
速度 值 , 给 出 你 的 理由 . 

.40 小 行星 的 谱 像 . 这 里 重新 给 出 练习 2.12 小 行 
星 的 数据 , 下 面 的 MINITAB 输出 给 出 了 描述 性 统 
计量 值 . I 
a. 在 输出 中 找 出 yY 和;. 


m 





3 4 3 1 
1 1 4 2 
3 3 2 1 
6 1 3 2 
资料 来 源 : Binzel, R. P. , and Xu, S. “Chips off of Asteroid 
4 Vesta; Evidence for the parent body of basaltic achondrite 
meteorites. "Science, Vol. 260, Apr. 3, 1993, p. 187( X1). 
b. HEKE ys, y £2s fl y 3s. 

c. 数 出 落 在 每 个 区 间 中 观测 值 个 数 . 

d. 经 验 法 则 和 切 比 雪夫 法 则 哪 一 个 能 更 好 地 描述 





数据 ? 
| "d mu ERE E — 
| Descriptive Statistics: EXPOSURE 
Variable N N* Mean SE Mean StDev Minimum Qi Median Q3 Maximum 
EXPOSURE 40 0 2.425 1.259 1.000 1.250 2.000 3.000 6.000 
练习 2. 40 的 MINITAB 输出 
相对 位 置 的 度量 


测验 分 数 与 一 些 社会 学 和 健康 状况 数据 通常 是 以 一 个 观测 值 在 分 布 中 相对 于 其 他 测验 分 数位 置 
的 方式 来 描述 的 . 观测 值 相对 位 置 的 两 个 度量 是 百 分 位 数 和 2z 得 分 . 

定义 2.11 数据 集 的 第 100p 百 分 位 数 是 这 样 一 个 y 值 ; 使 得 在 数据 集 的 相对 频率 分 布 中 有 
100p% 的 面积 位 于 它 的 左边 , 有 100(1 -p)% 的 面积 位 于 它 的 右边 . ( 注 ， Oxpzl.) 

例如 , 在 一 个 工业 工程 学 课程 中 , 如 果 你 的 成 绩 位 于 第 84 百 分 位 数 , 则 有 84% 的 成 绩 低 于 你 ， 
16% 的 成 绩 高 于 你 . 

中 位 数 就 是 第 50 百 分 位 数 . 对 一 个 数据 集 而 言 , 第 25 百 分 位 数 、 中 位 数 、 第 75 百 分 位 数 分 别称 


作 下 四 分 位 数 , 中 四 分 位 数 和 上 四 分 位 数 . 

一 个 数据 集 的 下 四 分 位 数 Q. 是 第 25 百 分 位 数 . 

一 个 数据 集 的 中 四 分 位 数 ( 或 中 位 数 )m 是 第 50 百 分 位 数 . 
一 个 数据 集 的 上 四 分 位 数 Qu 是 第 75 百 分 位 数 . 


定义 2. 12 
定义 2. 13 
定义 2. 14 
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对 于 一 个 大 的 数据 集 ( 如 和 人口), 通过 确定 曲线 ( 相对 频率 分 布 ) 下 相应 的 面积 来 寻找 四 分 位 数 . 
然而 当 感 兴趣 的 数据 集 较 小 时 , 要 在 数据 集中 找 一 个 测量 值 , 譬如 说 , 找 精确 地 超过 其 余 25% 测量 
值 是 不 可 能 的 . 因此 , 一 个 数据 集 的 第 25 百 分 位 数 (或 下 四 分 位 数 ) 不 是 很 好 定义 的 . 对 于 小 的 数据 
R, 下 面 方 框 中 给 出 了 确定 四 分 位 数 和 其 他 百 分 位 数 的 一 些 法 则 . 





小 数据 集 的 四 分 位 数 ( 和 百 分 位 数 ) 
步骤 1 把 数据 集中 的 测量 值 按 大 小 升序 排列 ， 设 ya), yay, UU, yn) 表示 排序 后 的 测量 值 . 


PUO ”计算 1= +1), 并 合 入 为 最 近 的 整数 . 把 顺序 为 1 的 测量 值 记 为 yi， 表示 下 四 分 位 数 或 
第 25 百 分 位 数 .( 注 ; lz 二 (n+1) 恰 在 两 个 整数 之 间 ， 则 向 上 取 整 , ) 
BRS 计算 wu= 雪 (n+1)， 并 合 入 为 最 近 的 整数 . 把 顺序 为 u 的 测量 值 记 为 ys OS Ewa Bc 


第 75 百 分 位 数 .( 注 : 着 w= 地 (n+1) 恰 在 两 个 整数 之 间 ， 则 向 下 取 整 . ) 


一 般 地 为 了 求 第 p 百 分 位 数 , 计算 i=p(n+1)/100, 并 合 入 为 最 近 的 整数 . 顺序 为 i 的 测量 值 记 为 
Yao)» 表示 第 p 百 分 位 数 . 











UEI 并 点 是 在 合金 适 块 凝固 过 程 中 形成 的 瑕 羔 . 为 了 度量 铸 块 中 斑点 水 平 ， 提出 了 一 个 斑点 指 
标 . 一 个 工程 师 小 组 做 了 某 些 试验 来 度量 某 种 类 型 超级 合金 的 斑点 指标 (Journal of Metallurg , 2004 年 
9 月 ). 表 2.5 给 出 了 nm=18 个 合金 试验 数据 , 画 出 数据 的 葵 叶 图 , 并 用 它 求 18 个 斑点 指标 的 下 四 分 
位 数 . 

解 表 2.5 中 的 数据 保存 在 FRECKLE 文件 中 . 图 2. 11 是 此 数据 集 的 MINITAB 2&nE B8, 这 个 图 
帮助 我 们 求 数据 集 的 下 四 分 位 数 . | 

R25 18 个 超级 合金 的 斑点 指标 
30. 1 22.0 14. 6 16. 4 12.0 2.4 22.2 10.0 15.1 
12.6 6.8 4.1 2.5 1.4 33.4 16.8 8.1 3.2 





资料 来 源 : Yang, W. H. , etal. , “A freckle criterion for the solidification of superalloys with a tilted solidifieation front, " Journal of 
Metallurgy, Vol. 56, No. 9, Sept. 2004 ( Æ IV). 


由 上 面 的 法 则 描述 ， 当 数据 按 大 小 升序 排列 时 ,下 四 分 位 数 QL 就 是 观测 值 y, 其 中 1= (n + 
1)⁄4. 因为 n=18, 1219/4 24.75, & Af88I 1-5. E] Stem-and-leaf of F-INDEX N = 18 
此 ， 当 数据 按 从 小 到 大 顺序 排列 时 ,下 四 分 位 数 01 就 ”| reat Unit = 1.0 
是 第 5 个 观测 值 , 即 Qi = yos. 对 寻找 小 数据 集 的 四 分 
位 数 和 百 分 位 数 , 茎 叶 图 是 有 用 的 . 你 可 以 看 到 第 5 个 
观测 值 就 是 茎 为 0 行 上 的 第 5 叶 . 这 个 值 相应 于 斑点 指 
标 4. 1. 因此 , 对 于 这 个 小 的 数据 集 Q, =4. 1. 

相对 位 置 的 另 一 个 有 用 度量 是 z 得 分 . 由 定义 ，z 
得 分 描述 了 以 标准 差 为 单位 , 观测 值 y 相对 于 均值 的 
位 置 . 负 的 z 得 分 表明 观测 值 位 于 均值 的 左边 , 正 的 z 图 2 11 合金 斑点 指标 的 MINITAB m EE 
得 分 表明 观测 值 位 于 均值 的 右边 . 由 经 验 法 则 可 知 , 一 个 数据 集中 大 部 分 观测 值 都 在 距离 均值 2 
个 标准 差 内 ( 即 z 得 分 绝对 值 小 于 2) , 且 几 乎 所 有 的 观测 值 都 在 距离 均值 3 个 标准 差 之 内 ( 即 z 得 
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分 绝对 值 小 于 3 ). 
定义 2. 15 ”一 个 数据 集中 7y 值 的 z 得 分 是 以 标准 差 为 单位 度量 y 位 于 均值 之 上 或 之 下 的 距离 . 


FOR iba i-i 
总 体 z 得 分 : z= 
o 


参考 例 2. 6 $1390 种 铁 矿石 样品 铁 含量 百分率 数据 , 求 出 并 解释 观测 值 为 66. 56% 89 z 
得 分 . 
解 回顾 样本 数据 的 平均 值 和 标准 差 ( 见 图 2. 10) 分 别 为 了 =65.74, s =0. 69. 38 y = 66. 56 代入 z 
的 公式 , 有 
z=(y-y)/s = (66.56 -65.74)/0. 69 =1.19 
因为 z 得 分 是 正 的 , 所 以 铁 含量 66. 56% 位 于 平均 值 65. 74% 上 方 ( 右边 )1. 19 个 标准 差 位 置 . 


ERAS 2.44 新 西 兰 灭绝 的 岛 类 . 参考 练习 2.9, Evolution- 
2.41 沼泽 地 中 磷 的 标准 . 佛罗里达 州 沼泽 地 中 一 个 M RAP 152 RR ` E Ces) f 
' 重 要 的 有 害 物质 是 总 磷 (TP). Chance (2003 年 夏 ) 的 名 类 类 型 研究 . " i (um) 


报道 了 一 篇 关于 建立 沼泽 地 中 水 质 TP 标准 的 文 保存 在 NZBIRDS 文件 中 . I | 
章 . 佛罗里达 州 环境 保护 所 (DEP) 收 集 了 28 438 a 求 蛋 长 度 分 布 的 第 10 百 分 位 数 ， 并 解释 这 


个 
泽 地 的 TP 浓度 . TP 分 布 的 第 75 百 分 位 数 是 10 FË. 
mg/L. DEP 建议 用 这 个 值 作为 TP 标准 , 即 任意 一 b. Moas, P. australis 鸟 蛋 长 度 为 205 mm, 求 这 种 鸟 
个 地 方 TP 含量 超过 10 mg/L 就 认为 是 不 安全 的 . 的 = 得 分 并 解释 这 个 值 
解释 第 25 百 分 位 数 这 个 值 , 为 什么 DEP 选择 它 作 245 游船 公共 卫生 检查 . 参考 练习 2.15, 游船 公共 
为 TP 标准 , 给 出 理由 . 卫生 的 评分 , 数据 保存 在 SHIPSANIT 文件 中 . 
2. 42 小 行星 的 谱 像 . 参考 练习 2. 12 和 练习 2. 40 中 a. Nautilus Explorer 的 得 分 为 74 分 , 给 出 它 的 相对 
给 出 的 小 行星 数据 . 位 置 度量 , 并 解释 这 个 结果 . 
a. 求 数据 集 的 下 四 分 位 数 和 上 四 分 位 数 , 解释 这 些 值 b. Rotterdam 的 得 分 为 93 分 ,给 出 它 的 相对 位 置 度 
b. 求 观测 到 6 个 独立 谱 像 曝 光 的 小 行星 观测 值 的 B, 并 解释 这 个 结果 . 
z 得 分 , 解释 这 个 值 . 2.46 AKP HHE. 美国 环境 保护 局 (EPA) 设 定 
2.43 土壤 中 的 氛 化 物 .， Enviromental Science & Tech- 了 饮用 水 中 铅 含量 的 限制 . EPA 关于 铅 的 执行 标 


nology(1993 年 10 月 ) 发 表 了 一 篇 关于 荷兰 土壤 污染 准 是 每 升水 中 0.015 mg( mg/L). 在 EPA 标准 下 ， 
的 文章 . 总 共 抽 取 了 72 个 400 g 土壤 样品 , 干燥 并 如 果 一 个 水 系统 研究 样本 90% 铅 浓度 少 于 0. 015 
分 析 污 染 物 氰 化 物 . 每 一 土壤 样品 中 和 氰 化 物 浓度 (每 mg/L, 认为 饮用 这 种 水 是 安全 的 . 我 (合作 者 Sin- 
千克 土壤 中 微克 ) 用 红外 线 显 微 镜 测 得 , 氰 化 物 浓 cich) 收 到 一 份 在 我 家 小 区 饮用 水 铅 含量 的 研究 报 


度 列 在 下 表 中 ,全 面 解释 下 表 中 的 描述 性 统计 量 . E. 研究 样本 的 第 90 百 分 位 数 锁 浓 度 为 0. 00372 
土壤 中 氰 化 物 浓度 统计 量 的 汇总 (mg/kg) mg/L. 在 我 的 小 区 中 水 消费 者 是 否 处 于 饮用 不 安 
全 铝 售 量 水 的 危险 中 ? 说明 原 因 . 
均值 84.0 ”上 四 分 位 数 88.5 2.47 生产 过 程 的 电压 读数 . 参考 练习 2. 14，Harris 
方差 6400 ”最 小 值 2.0 公司 关于 两 个 地 方 电压 读数 的 研究 . 
中 位 数 28.8 最 大 值 3 320.0 a. 计算 在 老 地 方 电压 读数 为 10. 50 的 z 得分. 
一 中 位 数 28.8 最 大 值 33200 _ 


资料 来 源 : Lamé, F. P. J. , and Defize, P, R. , “Sampling b. 计算 在 新 地 方 电压 读数 为 10.50 的 z 得 分 . 

of contaminated soil; Sampling error in relation to sample size e. 基于 a 和 b 中 的 结果 ， 在 哪个 地 方 更 可 能 出 现 
and segregation. ” Environmental Science & Technology, Vol. 10. 50 的 电压 读数 ? 说 明 原 因 . 

27, No. 10, Oct. 1993, p. 2039(3 IT. .48 眼睛 折射 的 研究 . 参考 练习 2. 29， ( Optometry 


N 
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and Vision Science, 1995 年 6 月 ) 关 于 眼睛 折射 变异 b. 求 柱 透镜 的 放大 率 测量 值 的 第 95 百 分 位 数 , 并 


性 的 文章 . 25 个 柱 透 镜 的 放大 率 测量 值 保存 在 解释 结果 . 
LEFTEYE 文件 中 . c. 计算 柱 透镜 的 放大 率 测量 值 为 1. 07 的 z 得 分 ， 
a. 求 柱 透镜 的 放大 率 测量 值 的 第 10 百 分 位 数 , 并 并 解释 结果 . 

解释 结果 . 


2.7 检测 异常 值 的 方法 


一 个 数据 集中 有 时 包含 了 不 一 致 的 观测 值 . 例如 ， 当 我 们 讨论 获 学 士 学 位 大 学 毕业 生 的 起 始 兰 
水 时 , 我 们 通常 想到 传统 的 大 学 毕业 生 一 一 那些 22 岁 左右 具有 4 年 大 学 教育 的 毕业 生 . 但 是 假设 其 
中 有 一 个 毕业 生 是 34 岁 的 化 学 工程 学 博士 , 他 重 返 大 学 ,又 获得 了 冶金 学 学 土 学 位 . 很 明 显 , 由 于 
这 个 学 生 附 加 的 教育 和 经 历 使 得 他 的 起 始 薪水 要 比 其 他 的 学 生 高 很 多 ， 我 们 可 能 不 希望 在 数据 集中 
包含 这 样 的 数据 . 对 于 这 样 一 个 位 于 我 们 想 要 描述 的 数据 范围 之 外 的 不 规则 观测 值 ， 称 为 异常 值 . 

定义 2. 16 ”相对 于 数据 集中 其 他 值 不 寻常 地 大 或 小 的 观测 值 y 称 为 异常 值 . 一 般 将 异常 值 归 和 个 
于 下 列 原因 之 一 : 

1. 观测 、 记 录 或 输入 计算 机 时 不 正确 的 测量 值 . 

2. 测量 值 来 自 不 同 的 总 体 . 

3. 测量 值 是 正确 的 , 但 是 代表 一 个 稀有 (偶然 ) 事 件 . 

确定 一 个 观测 值 是 否 异常 ,最 明显 方法 是 计算 它 的 z 得 分 (2.6 节 ). 
参考 自 1977 年 以 来 世界 上 与 能 源 有 关 的 45 起 导致 多 人 死亡 事故 的 样本 数据 . (数据 保存 
在 ENERGY 文件 中 . ) 数 据 集 不 仅 包含 与 能 源 有 关 的 死亡 事故 的 原因 ， 还 包含 每 一 事故 中 死亡 人 数 的 
信息 . 数据 集 的 第 一 个 观测 值 是 1979 FREERKS, 2 500 人 死亡 , 这 个 观测 值 是 异 
常 值 吗 ? 

解 图 2.12 给 出 了 45 起 与 能 源 有 关 事 故 中 死亡 人 数 的 描述 性 统计 量 的 SPSS 打印 输出 . 输出 中 
着 重 显示 的 均值 为 7= 243. 3, 标准 差 为 s=398.2， 因此, 死亡 人 数 为 y=2 500 的 观测 值 的 z 得 分 是 : 

z= (y —y)/s = (2 500 -243.3)/398.2 =5.67 
经 验 法 则 表明 , 数据 集中 几乎 所 有 观测 值 的 得 分 绝对 值 小 于 3, 切 比 雪夫 法 则 保证 至 多 有 1/9( 即 
11% ) BJ z 得 分 的 绝对 值 大 于 3. 因为 z 得 分 如 5.67 这 么 大 是 很 稀少 的 , 所 以 测量 值 y=2 500 称 为 异 
常 值 . 尽管 这 个 值 记录 是 正确 的 , 但 是 1979 年 的 事故 主要 是 由 于 发 生 在 印度 的 严重 洪水 灾害 引起 了 
该 国 最 大 水 电大 坝 的 声 塌 . 


Descriptive Statistics 


Std. 
FATALITIES 45 31 2500 44331 | 598.216 
Valid N (tistwise) 45 


图 2. 12 与 能 源 有 关 的 死亡 事故 数 SPSS 描述 性 统计 量 


检测 异常 值 的 另 一 个 方法 是 构造 样本 数据 的 盒子 图 , 利用 这 种 方法 ， 建立 类 似 于 经 验 法 则 的 
Y X258 y +3s KÈ, 然而 这 里 的 区 间 用 四 分 位 数 间 距 代 替 标准 差 ç. 
定义 2. 17 ”四 分 位 数 间距 IQR 是 上 四 分 位 数 和 下 四 分 位 数 的 距离 ， 
IQR=ou - QL 









32 第 2 章 





区 间 [ QL -1.5(IQR), Qu +1.5(IQR)] 和 [ 01 -3(IQR), Qu *3(IQR) ] 是 盒子 图 检测 异常 值 的 
关键 . 

盒子 图 的 要 素 列 在 下 面 的 方 框 中 . 对 一 个 小 的 数据 集 , 盒子 图 相对 容易 构造 , 因为 四 分 位 数 和 
四 分 位 数 间距 可 以 很 快 确定 . 然而 由 于 几乎 所 有 的 统计 软件 都 包含 盒子 图 的 程序 , 因此 我 们 利用 计 
算 机 作出 盒子 图 . 





盒子 图 的 要 素 

1. 以 画 在 下 四 分 位 数 和 上 四 分 位 数 (QL 和 Q) 的 直线 为 边界 (关键 点 ) 画 一 个 长 方形 (盒子 ) ,在 盒子 
中 标 出 数据 的 中 位 数 ， 常 用 直线 表示 . 

2. 将 距 每 一 关键 点 1.5(IQR) 处 的 点 标记 为 数据 集 的 内 篇 僚 . 把 每 一 关键 点 到 内 筑 估 之 内 的 末端 测量 
值 用 线 ( 须 线 ) 连接. 

TAARE =Q, ~1.5(IQR) 
ENARE =Q +1.5(IQR) 

3. 第 二 对 篇 色 一 一 外 篇 镶 ， 出 现在 从 关键 点 3 倍 的 四 分 位 间距 3(IQR) Ab. 用 符号 (如 “ "E # 
NE ERE E 2 EWUEE, 用 男 一 符号 (如 “0”) 表 示 超 过 外 第 人 久 的 测量 值 . AREE BUT IB, B E 
有 一 个 或 几 个 测量 值 超 出 了 它们 . 

T€ E =Q. -3(IQR) 
上 侧 外 第 多 = Q, +3(IQR) 

4. 根据 你 使 用 的 盒子 图 软件 不 同 , 表示 中 位 数 和 极 值 数据 点 (超出 第 信和 的 点 ) 的 符号 也 是 变化 的 .( 如 

果 你 想 手 画 一 个 盒子 图 ,你 可 以 使 用 自己 的 符号 . ) 你 应 当 查 看 程序 文件 明确 所 用 的 符号 . 








帮助 解释 盒子 图 

l 检查 盒子 的 长 度 . IQR 是 样本 变异 性 的 度量 , 对 于 两 个 样本 的 比较 是 特别 有 用 的 . 

2. 直观 地 比较 须 线 的 长 度 , 如果 一 端 明显 地 较 长 , 则 数据 的 分 布 可 能 偏向 须 线 长 的 方向 . 

3. AHALE ERWEE, 即使 对 于 很 偏 的 分 布 , 应 当 少 于 5% B kE EGRE N É 0 2 B. 外 篇 估 之 外 
的 测量 值 可 能 是 异常 值 ， 有 以 下 之 一 解释 : 

a. 这 个 测量 值 是 不 正确 的 ,可 能 是 不 正确 地 观测 、 记 录 或 输入 计算 机 . 

b. 这 个 测量 值 和 样本 中 其 他 的 测量 值 属 于 不 同 的 总 体 . 

e. 这 个 测 最 秆 是 正确 的 , 并 且 和 其 他 测量 信和 来 自 同一 个 总 体 . 通常 我 们 都 是 在 仔细 排除 所 有 其 他 解释 
以 后 才 接 受 这 个 解释 . 











参考 例 2.9 和 保存 在 ENGERGY 文件 中 45 起 与 能 源 有 关 事 故 中 死亡 人 数 的 数据 . 作出 数 
EHATE, 并 利用 它 检测 异常 值 . 

解 ” 我 们 用 MINITAB 作 死亡 人 数 的 盒子 图 . 盒子 图 以 及 某 种 描述 性 统计 , 如 图 2. 13 所 示 . 

由 打印 输出 ,下 四 分 位 数 和 上 四 分 位 数 分 别 为 Q, = 69 和 Qu = 253. 这 些 值 形成 图 2. 13 中 盒子 
的 边界 . (中 位 数 m=114, 用 盒子 内 的 一 条 水 平 线 标 出 . ) 四 分 位 数 间距 IQR = Qu - 0, =253 -69 = 
184, 用 于 作 盒子 图 的 管 乱 和 须 线 . 几 个 高 度 疑似 异常 值 在 图 2. 13 中 (用 星 号 ) 标 出 . 在 死亡 人 数 500 
附近 出 现 2 个 异常 值 , 死亡 人 数 1 000 附近 有 一 个 , 2 500 附近 有 一 个 . ( 注 : 最 大 异常 值 是 例 2.9 中 
指出 的 那个 观测 值 . ) 
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Descriptive Statistics: Fatalities 


Variable N Mean StDev Q1 Median Q3 
Fatalities 45 243.3 398.2 69.0 114.0 253.0 


Boxplot of Fatalities 


2500 T. x 


2000 





1500 ] 


Fatalities 


1000 4 


500 4 











L. Bs 到 
图 2. 13 与 能 源 有 关 的 死亡 事故 数 的 MINITAB 描述 性 统计 量 和 盒子 图 





z 得 分 和 盒子 图 法 都 给 出 了 经 验 法 则 的 界限 , 超过 界限 的 y 值 认为 是 异常 值 . 这 两 种 方法 通常 得 
到 类 似 的 结果 . 然而 , 数据 集中 一 个 或 多 个 异常 值 的 存在 可 能 使 得 用 于 计算 z 得 分 的 * 值 增 大 . 因此 ， 
一 个 不 规则 观测 值 z 得 分 绝对 值 大 于 3 的 可 能 性 减少 . 相反 , 用 于 计算 盒子 图 管 笛 的 分 位 数值 不 受 异 
常 值 存在 的 影响 . 


检测 异常 值 的 经 验 法 则 9 











疑似 异常 值 高 度 疑 似 异常 值 
盒子 图 RES Y: E PEE GS DLP MS 5 
z 得 分 : 2x |z|<3 |z|>3 
3 S 
) se " — < s "a P _ " 
应 用 练习 c. 解释 上 四 分 位 数 Q,. 


2. 49” 煤 夸 中 的 包含 量 . 一 种 销路 用 的 砖 块 一 一 称 作 1 求 四 分 位 数 间距 ，IQR. 
烧 砖 一 一 检测 其 中 所 含 的 微量 元 素 以 确定 烧 砖 的 e. REUS BEGCT PELO PL BRE EC 
来 源 ( 如 工厂 ). (Advances in Cement Research , 2004 £. BEDA BUR SLBCG — Hue ik BIS BUR SEP ME E 





年 1 月 ) 测 量 了 200 块 烧 砖 的 钢 含 量 ( mg/kg) ,得 7, 这 说 明 什么 ? 

到 以 下 统计 量 Q, =115, m = 170 和 Q, =260. 2.50 小 行星 的 谱 像 . 参考 练习 2. 12 和 练习 2. 40 中 
a. 解释 中 位 数 m. 给 出 的 小 行星 数据 . 

b. 解释 下 四 分 位 数 Q. a. 作 数 据 的 盒子 图 , 你 是 否 检 出 任何 异常 值 ? 





O “得 分 和 盒子 图 法 都 给 出 了 经 验 法 则 的 界限 , 超过 界限 的 y 值 认 为 是 异常 值 . 这 两 种 方法 通常 得 到 类 似 的 结果 . 然而 ， 
数据 集中 一 个 或 多 个 异常 值 的 存在 , 可 能 使 得 用 于 计算 z 得 分 的 值 增 大 . 因此 ， 一 个 不 规则 观测 值 z 得 分 绝对 值 大 于 
3 的 可 能 性 减少 . 相反 , 用 于 计算 盒子 图 区 间 的 分 位 数值 不 受 异 常 值 存在 的 影响 . 
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b. Hiz 得 分 法 检测 异常 值 . 

2. 51 生产 过 程 的 电压 读数 . 参考 练习 2. 14 中 给 出 
的 电压 读数 . 

a. 作 老 地 方 生产 数据 的 盒子 图 , 你 是 否 检 出 任何 
异常 值 ? 

b. 用 z 得 分 法 检测 老 地 方 生产 数据 的 异常 值 . 

c， 作 新 地 方 生产 数据 的 盒子 图 , 你 是 否 检 出 任何 
异常 值 ? 

d. 用 z 得 分 法 检测 新 地 方 生产 数据 的 异常 值 . 

e. 把 a fll c 中 的 两 个 盒子 图 放 在 一 起 ， 比 较 这 两 
个 地 方 电压 读数 的 分 布 ? 

2.52 游船 公共 卫生 检查 . 参考 练习 2. 15 中 游船 公 

共 卫 生 的 评分 . 

a. 用 盒子 图 法 检测 数据 中 的 异常 值 . 

b. JH z 得 分 法 检测 数据 中 的 异常 值 . 

c. 这 两 种 方法 一 致 吗 ? 如 果 不 一 致 , 解释 为 什么 . 

2.53 M Hop st. 一 个 化 工厂 生产 一 种 物质 ， 
其 中 包含 98% 研 碎 的 谷 粒 和 2% 的 磷 化 锌 ,用 于 控 
制 甘蔗 地 中 的 鼠 群 . 生产 过 程 必须 仔细 控制 ,以 保 
持 2% 的 磷 化 锌 . 因为 磷 化 锌 太 多 会 危害 甘蔗 , 太 
少 对 控制 鼠 群 没有 作用 . 以 前 生产 过 程 的 记录 表 
BH, 物质 中 磷 化 锌 实际 百分比 分 布 是 近似 丘 形 的 ， 
均值 为 2 096 , 标准 差 为 0.08%. 假设 随机 选择 的 
一 批 实际 上 包含 1. 80% 的 磷 化 锌 ,能 否 表明 今天 
产品 中 磷 化 锌 的 含量 太 小 ? 说 明 你 的 理由 . 

2.54 机 器 人 的 感应 运动 . 卡 内 基 梅 隆 大 学 的 研究 人 
员 开 发 了 一 种 算法 , 用 安装 在 手臂 上 的 一 台 具 有 
惯性 感应 的 照相 机 估计 机 器 人 手臂 的 感应 运动 . 
(The International Journal of Robotics Research , 2004 


2.0 描述 性 统计 牌 曲 事实 真相 


年 12 月. ) 感 兴趣 的 两 个 变量 是 估计 手臂 转动 误差 
(用 弧度 度量 ) 和 估计 手臂 移动 误差 (用 厘米 度量 ). 
11 个 试验 数据 列 在 表 中 , 在 每 一 次 试验 中 ,照相 机 
的 固有 干扰 和 投影 干扰 是 在 变化 的 . 

a. 求 在 有 固有 干扰 而 无 投影 干扰 试验 中 移动 误差 
的 y Hl s. 

b. 求 在 有 投影 干扰 而 无 固有 干扰 试验 中 移动 误差 
的 y 和 s. 

c. 某 次 试验 的 移动 误差 是 4.5 cm, 这 个 值 是 有 固 
有 干扰 而 无 投影 干扰 试验 的 异常 值 吗 ? 是 有 投 
影 干扰 而 无 固有 干扰 试验 的 异常 值 吗 ? 在 这 次 
试验 中 更 可 能 发 生 哪 种 类 型 的 相机 干扰 ? 








试验 国有 投影 转动 误差 移动 误差 
干扰 干扰 (BE) (em) 
1 5 3$  0.0000034 0. 0000033 
2 是 否 0.032 1.0 
3 是 # 0.030 1.3 
4 是 否 0.094 3.0 
5 是 S 0.046 1.5 
6 是 S 0.08 1.3 
7 5 E 027 22.9 
8 5 是 0.19 21.0 
9 * E 0.4 34.4 
10 Ei Ro 05 29.8 
11 5 是 oom 17.7 





资料 来 源 : Strelow, D. , and Singh, S. , "Motion estimation 
form image and inertial measurements. " The International Jour- 
nal of Robotics Research, Vol. 23, No. 12, Dec. 2004 ( à 4). 


图 形 可 能 “ 胜 过 千言 万 语 ”， 但 是 图 形 也 能 影响 信息 或 焉 曲 信息 . 事实 上 , 统计 学 中 的 图 


形 





直方 图 、 条 形 图 和 其 他 图 描述 法 是 可 以 曲解 的 ,所 以 我 们 必须 小 心地 检查 其 中 的 每 个 图 . 在 


这 一 节 中 ,我们 首先 提出 在 解释 图 表 时 要 提防 的 一 些 陷阱 ,然后 讨论 数值 描述 性 统计 是 如 何 用 于 亚 





曲 事实 的 . 表 2.6 不 同 区 域 海 船 的 碰撞 
一 个 常用 的 方法 是 改变 垂直 轴 、 水 平 轴 或 两 个 轴 的 刻度 来 场所 ERA 
改变 图 形 传达 给 我 们 的 印象 . 例如 , #2 6 汇总 了 5 年 内 运行 在 海上 376 
欧洲 水 域 的 大 型 海 船 发 生 碰 接 的 数据 . 图 2. 14 是 MINITAB 条 形 DKA M 
图 , 给 出 了 三 个 场所 发 生 碰撞 的 频数 . 图 形 表明 在 “口岸 "发 生 总 数 1 127 


碰撞 的 次 数 比 在 “海上 ”或 “限制 水 域 " 要 多 . 


资料 来 源 : The Dock and Harbour Authority , 


假如 你 想 用 同样 的 数据 夸大 “口岸 ” 磁 撞 次 数 和 “限制 水 Dec/Jan. 1985—1986. 
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域 ”碰撞 次 数 的 差别 . 一 种 达到 这 个 目的 的 方法 就 是 增加 纵 轴 上 相继 单元 之 间 的 距离 , 也 就 是 说 , 用 
每 英寸 只 画 几 个 单位 来 拉 长 纵 轴 , 暴露 拉 长 的 踪迹 是 一 条 长 纵 轴 , 但 常 被 以 原点 O 以 上 的 某 个 点 作 
为 纵 轴 的 起 点 掩盖 了 . 如 图 2. 15 中 SPSS 输出 图 就 是 这 样 的 图 , 条 形 图 的 起 点 在 250 次 碰撞 (代替 
0), “口岸 "碰撞 的 频数 看 起 来 比 在 “限制 水 域 " 碰 撞 的 频数 多 很 多 . 


Chart of LOCATION 





NUMBER 

















Port ResWater 


AtSea 





InPort AtSea 
LOCATION LOCATION 
图 2. 14 不 同 场所 船只 碰撞 的 图 2. 15 不 同 场所 船只 碰撞 的 SPSS 
MINITAB 条 形 图 条 形 图 调整 的 纵 轴 





拉 长 或 缩短 纵 轴 可 以 加 强 或 减低 条 形 图 中 类 型 的 变化 . 用 条 形 图 造成 视觉 错觉 的 另 一 种 方法 是 
让 长 方形 的 宽度 与 高 度 成 比例 . 例如 , 图 2. 16a 的 条 形 图 描述 了 4 条 主要 高 速 公路 一 年 中 交通 事故 死 
亡 总 人 数 的 百分率 . 现在 如 果 我 们 让 长 方形 的 宽度 和 高 度 随 着 死亡 事故 百分比 的 增 大 而 增 大 ， 这 个 
变化 显示 在 图 2. 16b rh. 读者 可 能 倾向 于 认为 长 方形 的 面积 与 每 条 高 速 公路 上 发 生死 亡 人 数 的 百 分 
率 相等 . 但 事实 上 ， 真正 的 死亡 事故 的 相对 频率 只 与 长 方形 的 高 度 成 比例 . 








人 
0.30 — 0.30 |- 
EN m 
f 0.15} f 0.15 = 
Inr ITT 
um 长 
0 0 
A B C D A B Ü D 
高 速 公路 高 速 公路 
a) 条 形 图 b) 条 形 的 宽度 随 高 度 增 大 而 增 大 


图 2.16 4 条 主要 高 速 公 路 发 生 汽车 死亡 事故 的 相对 频率 


尽管 我 们 只 讨论 了 利用 图 形 传达 现象 误导 情景 的 几 种 方法 ， 但 是 教训 是 明显 的 . 用 严谨 的 态度 
检查 数据 的 所 有 图 形 描述 ， 特别 是 检查 轴 和 每 一 条 轴 上 单位 的 大 小 ， 不 必 理 会 视觉 上 的 变化 , 而 专 
注 于 图 表 指出 的 实际 数值 变化 . 

用 数值 描述 性 度量 同样 可 以 焉 曲 数据 集 的 信息 , 考虑 例 2.9 和 2. 10 分 析 过 的 45 个 与 能 量 有 关 
事故 的 数据 (保存 在 ENERGY 文件 中 ). 假如 你 想 用 一 个 数 更 好 的 描述 在 一 次 事故 中 有 “代表 性 ”的 


Ax 
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死亡 人 数 , 一 个 选择 就 是 死亡 人 数 的 平均 数 . 在 例 2.9 中 , 我 们 指出 了 平均 7=243.3 人 死亡 . 然而 如 
果 检 查 ENERGY 文件 中 的 数据 , 你 会 发 现 45 起 事故 中 有 34 起 事故 ( 约 75% ) 死 亡 人 数 低 于 平均 值 . 
换 句 话说 , 243.3 不 是 数据 集 非常 有 “代表 性 ”的 事故 . 这 是 因为 (如 2.4 节 讨 论 ) 数 据 集 的 极端 值 使 
平均 值 增 大 . 回顾 ( 例 2.10), 有 一 个 事故 中 2 500 人 死亡 , 男 一 个 有 1 000 人 死亡 , 这 两 个 非常 没有 
代表 性 的 值 使 均值 增 大 . 图 2. 17 给 出 了 当 从 数据 集中 删 去 这 些 异 常 值 时 , 均值 的 变化 情况 . 当 删 去 
最 严重 的 事故 (2 500 人 死亡 ) 后 , 平均 值 降 为 了 7= 192; 当 把 两 个 异常 值 都 删 去 时 , 平均 值 降 为 
y2173.2. 





Descriptive Statistics: Fatalities (All Data) 

Variable N Mean StDev Qi Median Q3 
Fatalities 45 243.3 398.2 69.0 114.0 253.0 
Descriptive Statistics: Fatalities (1 Outlier Deleted) 
Varisble N Mean StDev Qi Median Q3 
Fatalities 44 192.0 202.8 68.5 107.0 225.5 
Descriptive Statistics: Fatalities (2 Outliers Deleted) 


Variable N Mean StDev Q1 Median Q3 
Fatalities 43 173.2 161.9 68.0 100.0 200.0 





BL2.17 与 能 源 有 关 事 故 死亡 人 数 的 MINITAB 描述 性 统计 量 


在 与 能 源 有 关 的 45 起 事故 中 , 死亡 人 数 中 心 趋势 的 较 好 度量 是 中 位 数 . 在 例 2. 10, 我 们 求 得 
中 位 数 是 m=114 人 死亡 . 由 定义 我 们 知道 , 一 半 事 故 的 死亡 人 数 低 于 114, 一 半 高 于 114. 因此 ， 
中 位 数 是 数据 集 的 更 有 “代表 性 ” 值 . 由 图 2. 17 可 以 看 到 ， 当 删 去 最 大 异常 值 后 , 中 位 数 m = 107; 
当 删 去 两 个 异常 值 后 , m =100. 所 以 由 于 删 去 了 数据 集 的 最 大 观测 值 ， 中 位 数 并 没有 发 生 戏剧 性 
变化 . 

样本 信息 的 另 一 个 牌 曲 是 仅 给 出 一 个 中 心 趋势 度量 时 , 为 得 到 数据 集 准 确 的 精神 形象 需要 中 心 
趋势 的 度量 和 变异 性 的 度量 . 例如 , 美国 环保 署 (EPA) 想 要 根据 他 们 估计 的 (平均 )EPA 城市 行车 里 
程 等 级 来 评定 两 种 车 型 的 排名 . 假设 A 型 的 平均 EPA 行车 里 程 是 每 加 仑 32 英里 , B 型 的 平均 EPA 
行车 里 程 是 每 加 仑 30 英里 . 根据 平均 值 ，EPA 评定 
A 比 B 好 . 

然而 , EPA 没有 考虑 行车 里 程 的 变异 性 . 作为 
一 个 极端 的 例子 , 假如 A 型 的 标准 差 是 每 加 仓 5 英 
E, 而 B 型 的 标准 差 仅 为 每 加 仑 1 英里 . 如 果 行 车 
里 程 是 丘 形 分 布 , 它们 可 能 如 图 2. 18 所 示 . 注意 到 
A 型 的 变异 性 很 大 , 表明 A 型 更 可 能 比 B 型 车 有 较 H 
低 的 行车 里 程 等 级 . 如 果 排 名 是 基于 较 低 行车 里 程 BB BA 
等 级 机 会 最 小 原则 , 则 B 型 优 于 A 型 . 图 2. 18 两 种 车 型 行车 里 程 分 布 


B 型 的 里 程 分 布 


相对 频率 


A 型 的 里 程 分 布 





一 
0 15 20 25 3032 35 40 45 50 
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快速 回顾 
重要 公式 
LLL 
RES 类 型 相对 频率 
_ 22 
y = 六 样本 均值 


P Pus URL 





s Pan 一 样本 方差 
s= Ve 样本 标准 差 
:= 7 样本 = 得 分 
z= LE 总 体 z 得 分 
IQR = Qu - QL 四 分 位 数 间距 
Q. - 1. 5(1QR) TH A ES 
Qu + 1. 5CIQR) ENARE 
QL -3 (IQR) FN F 5 
Qu + 3(IQR) -Eftl ^ E 
本 章 总 结 提示 


° 定性 数据 的 图 形 法 : 饼 图 、 条 形 图 和 帕 雷 托 图 . 

° 定量 数据 的 图 形 法 : 点 图 、 芭 叶 图 和 直方 图 . 

° 中 心 趋势 的 数值 度量 : 平均 值 、 中 位 数 和 众 数 . 

* 变异 的 数值 度量 : 极 差 、 方 差 和 标准 差 . 

° 样本 的 数值 描述 性 度量 称 作 统计 量 . 

° 总 体 的 数值 描述 性 度量 称 作 参数 . 

° 确定 落 在 区 间 ( 均 值 ) +2( 标 准 差 ) 测 量 值 百分比 的 法 则 ; 切 比 雪夫 法 则 (至 少 75% ) 以 及 经 
验 法 则 (近似 95% ). 

° 相对 位 置 的 度量 ; 百 分 位 数 得 分 和 z 得 分 . 

° 检测 异常 值 的 方法 : 盒子 图 和 z 得 分 . 


补充 练习 a 解释 饼 图 . 


2.55 磨损 的 轮胎 . 下 面 的 饼 图 描述 了 美国 每 年 b. 把 饼 图 转换 为 相对 频率 条 形 图 . 
25 000 万 报废 汽车 轮胎 的 命运 . c 把 饼 图 转换 为 频数 条 形 图 . 
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第 2 £ 





倾倒 
77.6% 





资料 来 源 : 美国 环境 保护 署 和 美国 固体 废弃 物 管理 协会 . 





a 表 中 汇总 的 是 哪 种 类 型 的 变量 , 定性 的 还 是 定量 
的 ? 给 出 变量 可 能 的 取 值 . 

b 计算 每 一 个 原因 的 相对 频率 . 

c 用 恰当 的 图 形 描述 表 中 的 信息 . 

d. 把 医学 作为 一 个 理由 要 求 安 装 可 开关 气 寺 的 车 主 
比例 . 

2.57 不 安全 的 佛罗里达 道路 . 佛罗里达 的 土木 工程 
师 正 在 用 最 新 的 定位 于 安全 的 建筑 方法 设计 道路 ， 
因为 在 佛罗里达 不 好 的 道路 伤害 的 人 数 比 枪击 更 
多 . 某 一 年 总 共有 135 起 交通 事故 归 因 于 修建 的 不 
好 道路 , 下 表 给 出 了 不 好 的 道路 条 件 引 起 的 事故 . 








画 出 并 解释 数据 的 帕 雷 托 图 . 
2.56 XH Z. 所 有 的 新 车 在 驾驶 座 和 副 驾 驶 座 都 
dORCUR, 以 防止 汽车 撞击 时 发 生 严 重 或 致命 伤 不 好 的 道路 条 件 死亡 人 数 
害 . 然而 , 在 低速 撞击 中 , 我 们 发 现 气囊 会 引起 儿 障碍 物 没有 警示 牌 7 
童 、 身 材 无 小 的 人 或 身体 残疾 的 人 死亡 . 因此 ， 修理 /建造 中 的 道路 39 
1998 年 联邦 政府 开始 允许 车 主 安装 可 开关 的 气 圳 . 不 坚 面 的 路 面 材料 13 
下 表 描 述 了 1998 年 和 1999 FREIE REAA 软 和 低 的 路 户 . 20 
驶 座位 安装 可 开关 气囊 的 原因 洞 、 凹 痕 等 8 
原因 要 求 的 人 数 积 水 25 
婴儿 1 852 破旧 的 道路 表面 6 
儿童 17 148 其 他 _17 
医学 8 377 总 数 135 
婴儿 站 医学 44 资料 来 源 : 佛罗里达 高 速 公路 安全 与 机 动车 辆 部 门 . 
儿童 & 医学 203 2.58 ”地震 后 余震 的 震级 . 参考 练习 2. 13, 2 929 个 
EUL & JLE 1 878 地 震 余震 的 震级 (里 氏 震 级 ) 数 据 保存 在 EARTH- 
婴儿 & 儿童 & 医 学 135 


总 数 30 337 
资料 来 源 : 美国 高 速 公 路 运输 安全 管理 协会 ，2000 年 
9 月 . 


QUAKE 文件 中 . 

a 数据 的 描述 性 统计 量 在 下 面 的 MINITAB 输出 中 
给 出 . 解释 这 些 统计 量 . 

b. 用 盒子 图 识别 数据 中 的 异常 值 . 





Variable N 
MAGNITUDE 2929 


Nean 





StDev Q1 
2.1197 20.6636 


Descriptive Statistics: MAGNITUDE 


Median Q3 


1.7000 2.0000 2.4000 





练习 2. 58 的 MINITAB 输出 


2.59 管道 表面 的 粗糙 度 . 参考 练习 2. 16, Anti-corro- 
sion Methods and Materials ( 2003 年 50 期 ) 关于 油田 
管道 表面 粗糙 度 的 文章 . 下 表 重 新 给 出 数据 ( nm) . 
求 一 个 最 可 能 包含 大 约 95% 的 管道 表面 粗糙 度数 
据 的 区 间 . 


—————M———————————————— 
1.72 2.50 2.16 2.13 1.06 2.24 2.31 2. 03 1. 09 1.40 
2.57 2.64 1.26 2.05 1.19 2.13 1.27 1.51 2.41 1.95 
资料 来 源 : Farshad, F., 
interior surface roughness as measured by three scanning probe 


instrements. ” Anticorrosion Methods and Materials, Vol. 50, 
No. 1, 2003( I). 





and Pesacreta, T. , " Coated pipe 
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2.60 新 车 的 撞击 测试 . 每 年 国家 公路 交通 安全 管理 


N 


. 62 


局 (NHTSA) 都 对 新 车 型 进行 撞击 测试 以 确定 汽车 
发 生 正面 碰撞 时 , 保护 司机 及 前 座 乘 客 的 能 力 . 
NHTSA 开发 了 一 套 正面 撞击 测试 的 星 级 得 分 系统 ， 
结果 从 一 颗 星 ( = ) 到 五 颗 星 ( ***** ). 等 级 中 的 
ERS, 在 正面 碰撞 中 撞击 保护 的 水 平 就 越 高 . 最 
近 一 年 NHTSA 对 98 辆 汽车 撞击 测试 的 结果 保存 
在 CRASH 文件 中 , 下 面 的 MINITAB 输出 中 汇总 了 
98 辆 汽车 驾驶 座 的 星 级 , 利用 输出 的 信息 建立 饼 
图 , 并 解释 图 形 . 














Tally for Discrete Variables: DRIVSTAR 
DRIVSTAR Count Percent 

2 4 4.08 

3 17 17.35 

4 59 60.20 

5 18 18.37 

N= 98 
计算 机 输出 


.61 新 车 的 撞击 测试 . 参考 练习 2.60 和 NHTSA 


撞击 测试 数据 . NHTSA 记录 的 一 个 定量 变量 是 司 

机 头 部 伤害 的 严重 性 (从 0 ~ 1500 fx RE) 保存 在 

CRASH 文件 中 . 98 个 汽车 司机 头 部 伤害 级 别 的 平 

均值 和 标准 差 如 下 面 的 MINITAB 输出 所 示 , 用 这 

些 值 求 司 机 头 部 伤害 等 级 为 408 的 z 得 分 , 并 解 

释 这 个 结果 . 

冰 磺 物 的 化 学 组 成 , 参考 练习 2. 20, American 

Journal of Science(2005 年 1 月 ) 关 于 沉积 的 冰 矿 物 

CRISE) 的 化 学 组 成 的 文章 . 26 个 沉积 的 冰 研 物 样 

mP ABe 比 的 数据 在 表 中 重新 给 出 . 

a. 计算 并 解释 Al/Be 比 中 心 趋势 的 三 个 数值 描述 
性 度量 . 

b. 计算 并 解释 ABe 比 三 个 变异 性 的 数值 描述 性 
度量 . 
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M 
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c. 作出 数据 的 盒子 图 ,你 是 否 检 出 异常 值 ? 
汽油 中 的 红色 染料 . 用 染料 给 纺织 品 、 纸 张 、 
皮革 和 食品 等 产品 着 色 , 法 律 要 求 必须 指明 汽油 中 
含有 铅 . 为 了 监测 环境 污染 , 我 们 需要 开发 分 析 方 
法 以 鉴别 、 确 定 这 些 染料 的 含量 . 在 某 一 研究 中 ， 
用 高 效 热能 液 相 色谱 法 来 显示 废水 和 汽油 中 的 染 
料 特征 . 下 表 给 出 了 汽油 中 商用 重 氮 红色 染料 成 分 
的 相对 含量 ( 出现 的 相对 频率 ). 用 条 形 图 表示 红色 
染料 成 分 的 相对 含量 , 并 解释 图 形 . 





红色 染料 混合 物 相对 含量 
H 0.021 I 
CH, 0.210 
CH; 0. 354 
C, H; 0. 072 
C7His 0.054 
Cs Hi 0. 127 
Co Hio 0.118 
Cio H5, 0.025 
其 他 0.019 


资料 来 源 ; Voyksner, R. D. , 


environmental samples by thermospray high-performance liquid 


" Characterization of dyes in 


chromatography/mass spectrometry. " Analytical Chemistry, 

Vol. 57, No. 13, Nov. 1985, p. 2601 ( € 1). Reprinted with 

permission. Copyright 1985 美国 化 学 学 会 . 

深 孔 钻探 . 参考 练习 1.13 , Journal of Engi- 

neering for Industry( 1993 年 5 月 ) 关 于 深 孔 钻探 的 文 

章 . 用 计算 机 模拟 生成 的 数据 对 钻 层 拥 塞 进行 分 

析 , 下 面 的 频数 直方 图 给 出 了 50 ASH K: BE (mm) 

的 模拟 分 布 . 

a. 把 频数 直方 图 转化 为 相对 频率 直方 图 . 

b. 由 a 中 的 图 形 , 你 能 否 观测 到 一 个 长 度 至 少 为 
190 mm KRA? WMA. 











3.76 4.00 3.81 32 31 3.30 3.21 3.32 4.00 3.90 50 3.85 3.88 
4. 06 4.56 3.60 3.27 4.0 3.38 337 2.73 2.95 2.25 2.733 2.55 3.06 
资料 来 源 ; 摘自 American Journal of Science, Vol. 305, No. 1 ,Jan. 2005, p. 16(¥ 2). 
Descriptive Statistics: DRIVHEAD 
Variable N Mean StDev Minimum Qi Median Q3 Maximum 
DRIVHEAD 98 603.7 185.4 216.0 475.0 605.0 724.3 1240.0 








练习 2.61 的 MINITAB 输出 
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120 140 160 180 


钻 届 长 度 (mm) 
练习 2. 64 的 频数 直方 图 


资料 来 源 : Chin, Jih-Hua, et al. “The computer simulatton and experimental analysis of chip 


monitoring for deep hole drilling. ” Journal of Engineering for Industry , Transactions of the 


ASME, Vol. 115, May 1993, p. 187( Ë] 12). 


2.65 KRAFA. 从 装 有 35 325 长 吨 矿 石 的 船上 随 
机 地 抽取 66 块 智利 块 状 铁 矿 石 样品 (95% 颗粒 大 
小 , 150 mm) ,确定 每 一 矿石 样品 中 铁 的 百分比 . 数 





据 如 下 表 所 示 . 
62. 66 61. 82 62. 24 
62. 87 63. 01 63. 43 
63. 22 63. 01 62. 87 
63. 01 62. 80 63. 64 
62. 10 62. 80 63. 92 
63. 43 63.01 63.71 
63.22 62. 10 63. 64 
63. 57 63. 29 64. 06 
61. 75 63.37 62. 73 
63. 15 61. 75 62.52 
63. 08 63. 29 62. 10 
63. 22 62. 38 63. 29 
63.22 62. 59 63. 01 
63. 08 63. 92 63. 36 
62. 87 63. 29 63. 08 
61. 68 63. 57 62. 03 
62. 45 62. 80 64. 34 
62.10 62.31 64. 06 
62. 87 63.01 62. 87 
62. 87 62. 94 63. 50 
62. 94 63. 08 63. 78 


62. 38 63. 43 62. 10 
一 -一 一 ~- < 
资料 来 源 : Sato, T. , Ho, K. , Chujo, S. , and Takahashi, 
U. , "Example of experiments on systematic sampling of iron 
ore. " Reports of Statistical Application Research , Union of Japa- 
nese Scientists and Engineers, Vol. 18, No. 1, 1971. 


a. 描述 所 抽样 的 总 体 . 

b. 给 出 这 个 抽样 方法 的 一 个 可 能 目标 . 

o 建立 数据 的 相对 频率 直方 图 . 

d. jH y fl s. 

e. 求 落 在 区 间 y+2s 内 的 观测 值 占 总 数 (n = 66) 的 
百分比 . 这 个 百分数 与 经 验 法 则 是 否 一 致 

f. 求 数据 集 的 第 25. 50. 75 和 90 百 分 位 数 ,并 解 
TELE. 


.66 土壤 样本 中 的 PCB. 参考 练习 1. 18 Chemo- 


sphere( 1986 年 2 H ) 关 于 获得 的 英国 土壤 样本 中 有 
SEU EAE SUDORE ( PCB) 基础 含量 信息 的 文章 . 这 个 
信息 作为 对 比 英国 废弃 设备 中 PCB 含量 的 基准 . 下 
表 给 出 了 英国 14 个 农村 和 15 个 城市 土壤 样本 测量 
的 PCB 含量 (0. 0001 g/kg). 由 这 些 基本 结果 , 研究 
者 报道 “农村 地 区 和 城市 地 区 (PCB 含量 ) 的 显著 不 
E”. 











农村 城市 
3.5 10 L6 120|240 11.0 107.0 18.0 
8.1 5.3 23.0 82290 490 940 120 
L8 9.8 L5 97]|160 220 141.0 18.0 
9.0 15.0 210 13.0 11.0 





资料 来 源 : Badsha, K. , and Eduljee, G. , “PCB in the U. 
K. environment—A preliminary survey. " Chemosphere, Vol. 
15, No. 2, Feb. 1986, p. 213( 31 ). Reprinted with Permis- 
sion. Copyright, 1986 年 版 ，Pergamon Press, Ltd. 
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N 


N 


N 


a. 画 出 农村 土壤 样本 中 PCB ARRAK. 

b， 画 出 城市 土壤 样本 中 PCB 含量 的 荃 叶 图 . 

c. 合并 农村 和 城市 土壤 样本 的 数据 , 画 出 荃 叶 图 . 
用 圆圈 在 图 上 标 出 每 个 城市 PCB 含量 . 这 个 图 
支持 研究 者 的 结论 吗 ? 


.67 意外 的 原子 能 紧急 停 堆 . 紧急 停 堆 是 核能 工 


程 师 用 于 描述 快速 紧急 停止 核反应 堆 的 专业 术 
语 . 原子 能 工业 做 了 一 致 的 努力 来 减少 意外 紧急 
停 堆 次 数 . 下 表 给 出 了 美国 近年 来 56 个 核反应 
堆 每 个 单位 紧急 停 堆 的 次 数 . 你 期 望 观测 到 一 个 
核反应 堆 在 未 来 有 11 次 意外 紧急 停 堆 吗 ? 
解释 . 





1 0 3 1 4 2 10 6 52 0 3 1 5 
4 2 712 0 3 82 0093 3 4 7 
2.4 5 3 2 71314 2 3 3 7 0 9 
4 3 5 27 8 52 43 4 0.1 7 





.68 工作 量 的 数据 . 工业 工程 师 会 定期 进行 “工作 


量 " 分 析 , 以 确定 生产 一 个 单位 产品 所 需要 的 时 
间 . 在 某 大 型 加 工厂 , 记录 每 天 为 执行 某 任务 所 需 
的 总 工时 数 . 下 面 给 出 了 50 天 的 记录 数据 . 


128 





119 95 97 124 128 142 98 108 120 


120 
131 


109 
128 
131 
112 


124 
103 
133 
111 


132 97 
135 “114 
131 88 
150 117 


138 
109 


133 136 
i00 111 


112 
113 
138 
122 


i8 jis 98 
122 97 116 92 


112 


a， 计 算数 据 集 的 平均 值 、 中 位 数 和 众 数 . 

b， 求 数据 集 的 极 差 、 方 差 和 标准 差 . 

c. 构造 区 间 了 +s, y+2s fuv cs 数 出 落 在 每 个 区 
间 内 的 观测 值 个 数 ， 并 求 HA. 比较 经 验 
法 则 的 结果 , Eks H SË 

d. 建立 数据 的 盒子 图 . 是 否 徐 出 异常 值 ? 

e. 求 日 总 工时 数据 的 第 70 方 分 位 数 , 解释 这 
个 值 . 










.69 石油 泄漏 对 海 网 的 影响 . Journal of Agricultural 


Biological, and Environmental Statistics (2000 年 9 H ) 
发 表 了 一 篇 关于 埃 克 森 瓦尔 笛 兹 (Exxon Valdez) 油 
船 的 石油 泄漏 对 阿拉 斯 加 威廉 王子 湾 附近 海 网 总 
体 影响 的 文章 . 分 析 的 一 部 分 数据 保存 在 EVOS 文 
件 中 , 数据 是 在 96 个 宽度 固定 、 长 度 变 化 的 海岸 线 
地 区 ( 称 作 样 条 ) 收集 的 . 对 每 一 样 条 , 记录 的 是 海 


N 


哆 数量 和 样 条 长 度 (km) 及 这 个 样 条 是 否 在 有 油 区 
域 . (EVOS 文件 中 的 前 5 个 和 后 5 个 数据 列 在 下 
dr.) 

a. 确定 测量 的 变量 是 定量 的 还 是 定性 的 . 

b， 确 定 试验 单位 . 

c. 用 饼 图 描述 有 油 区 域 和 无 油 区 域 样 条 的 百分数 . 

d. 用 图 形 法 检查 观测 到 的 海鸥 个 数 和 样 条 长 度 的 
关系 . 

.观测 到 的 海 鸭 密度 定义 为 观测 的 海 网 个 数 除 
以 样 条 长 度 . 对 无 油 样 条 和 有 油 样 条 , THE 
海鸥 密度 的 MINITAB 描述 性 统计 量 的 输出 . 
评估 有 油 和 无 油 样 条 中 海鸥 密度 的 分 布 是 否 
不 同 . 

- 对 于 无 油 样 条 , 给 出 一 个 至 少 包含 75% BTE RS 385 

度 值 的 最 可 能 区 间 . 

对 于 有 油 样 条 , 给 出 一 个 至 少 包含 75% 的 海鸥 

密度 值 的 最 可 能 区 间 . 

哪 一 种 类 型 的 样 条 ,有 油 或 无 油 海 网 密度 更 有 

可 能 为 16? 说 明 原因 . 


e 


m 


gs 


B 








样 条 海鸥 长 度 油 
1 0 4.06 无 
2 0 6.51 = 
3 54 6.76 x 
4 0 4. 26 X 
5 14 3.59 x 

92 7 3.40 有 

93 4 6. 67 有 

94 0 3. 29 有 

95 0 6. 22 有 

96 27 8. 94 有 





资料 来 源 : McDonald, T. L. , Erickson, W. P. and McDo- 
nald, L. L. , “ Analysis of count data from before-after eontrol- 
impact studies. " Journal of Agricultural, Biological, and Envi- 
ronmental Statistics, Vol 5, No. 3, Sept. 2000, p. 277 - 278 
(XA. 1). 


70 来 自 星系 光 的 速度 . 参考 练习 2.39, The Astro- 
nomical Journal 关于 星系 速度 的 研究 . 称 作 A1775 
的 第 二 星云 团 认为 是 一 个 双子 星云 团 ， 即 两 个 紧邻 
的 星云 团 . 来 自 星云 团 A1775 的 51 个 速度 观测 值 
(km/s) FUE T 3. 
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22922 20210 21911 19225 18792 21993 23059 a. 用 图 形 法 描述 星云 团 A1775 的 速度 分 布 

20785 22781 23303 22192 19462 19057 23017 b. 检查 a 中 的 图 ， 有 证 据 支持 双子 星云 团 理论 吗 ? 

20186 23292 19408 24909 19866 22891 23121 说 明 原因 . 

19673 23261 22796 22355 19807 23432 22625 c 计算 星云 团 A1775 中 星系 速度 的 数值 描述 性 度 

22744 22426 19111 18933 22417 19595 23408 量 (如 平 沟 值 和 标准 差 ) 根据 得 到 的 结 A. 你 
可 能 需要 计算 两 个 集合 , 也 就 是 双子 云 团 中 的 

22809 19619 22738 18499 19130 23220 22647 每 一 个 星云 团 (譬如 说 A1775A 和 A1775B) 的 数 

22718 22779 19026 22513 19740 22682 19179 值 描述 性 度量 . 

19404 22193 





资料 来 源 ; Oegerle, W. R. , Hill, J. M. , and Fitchett, M. 


.假如 你 观测 到 一 个 星系 , 速度 为 20 000 kms, 
这 个 星系 是 属于 星云 团 A1775A 还 是 A1775B? 





J. , "Observations of high dispersion clusters of galaxies; Con- 说 明 原因 . 
straints on cold dark matter. ” The Astronomical Journal, Vol. 
110, No. 1, July 1995, p. 34( 表 1). p. 37( 图 1). 
Descriptive Statistics: Density 
Variable Oil N Mean StDev Minimum Q1 Median Q3 Max imum 
Density no 36 3.27 6.70 0.000 0.000 0.890 3.87 36.23 
yes 60 3.495 5.968 0.0000 0.000 0.700 5.233 32.836 











71 油船 外 这 的 破损 . 由 于 油船 的 几 次 较 大 的 海洋 
石油 泄漏 , 美国 国会 通过 了 1990 石油 污染 条 例 . 这 
个 条 例 要 求 所 有 油船 必须 设计 较 厚 的 外 壳 . 自 此 以 
后 , 不 断 提 出 油船 结构 设计 的 进一步 改进 , 目的 在 
于 降低 石油 泄漏 的 可 能 性 , 减少 外 壳 戳 破 事件 中 石 
油 流出 量 . 为 了 帮助 这 一 方面 的 研究 ，Marine Tech- 
nology(1995 年 1 月 ) 报 道 了 近来 50 个 主要 的 油船 
和 其 他 运输 工具 导致 石油 泄漏 的 惟 破 原因 和 泄漏 
量 ( 千 米 吨 ).[ 注 : 截 破 原因 分 为 碰撞 (C) 、 火 灾 / 
爆炸 (FE) 、 外 壳 破 损 (HF) 或 搁浅 (G) ] 数 据 保存 
在 OILSPILL 文件 中 . 

用 图 形 法 描述 50 艘 油船 石油 泄漏 的 原因 . 这 个 
图 是 否 说 明 某 个 原因 比 其 他 原因 更 可 能 发 生 ? 

对 设计 工程 师 来 说 这 个 信息 如 何 ? 

. 求 出 并 解释 这 50 个 泄漏 量 的 描述 性 统计 量 . A 
用 这 个 信息 构造 一 个 区 间 , 预测 下 一 次 重大 右 
油 泄漏 事故 泄漏 的 量 . 

.72 人工 物料 搬运 . 工程 师 有 -一 个 小 组 专门 研究 独 
立 的 人 类 活动 , 如 提起 、 放 下 、 推 、 拉 、 搬 或 者 抓 取 
和 释放 一 个 物体 一 一 人 工 物 料 搬 运 活动 ，( MM- 
HA). M. M. Ayoub 等 ( 1980) 曾经 尝试 研究 关于 
MMHA 中 力量 和 能 力 的 标准 . 作者 指出 力量 和 能 力 
一 个 明显 的 区 别 就 是 “力量 表明 一 个 人 在 一 次 努力 
下 能 做 到 的 ， 而 能 力 表 明 一 个 人 在 一 段 较 长 时 间 内 
能 做 到 的 . 例如 , 提起 的 力量 决定 在 经 常 间隔 内 提 
起 的 量 . "下 表 给 出 的 是 Ayoub 等 推荐 的 一 部 分 女 


a. 





性 和 男性 的 提起 能 力 , 这 个 表 给 出 了 把 一 个 30 em 

宽 的 箱子 以 两 种 不 同 的 提升 速度 一 一 每 分 钟 1 次 

和 每 分 钟 4 次 , 安全 地 从 地 面 提 到 膝 高 的 最 大 重量 

(kg) 的 均值 和 标准 差 . 

a. 对 这 4 种 性 别 及 每 分 钟 提升 次 数 的 组 合 , 给 出 
最 大 建议 提升 重量 的 相对 频率 分 布 . 经 验 法 则 能 
帮助 你 做 这 件 事 . 

构造 这 四 组 数据 每 一 组 的 7 了 + 上 2s 区 间 . 给 出 测量 
值 落 在 这 个 区 间 的 比例 . 

. 假设 Ayoub 等 的 建议 MMHA 是 合理 的 , 你 期 望 
一 个 平常 的 男性 能 够 以 每 分 钟 4 次 的 速度 把 一 
个 重 25 kg( 宽 30 em) 的 箱子 从 地 面 提升 到 膝 高 ? 
一 个 平常 的 女性 呢 ? 解释 . 





性 别 次 /分 钟 均值 标准 差 
男 1 30. 25 8. 56 
4 23. 83 6.70 
女 1 19. 79 3.11 
4 15.82 3.23 


资料 来 源 ; Ayoub, M. M. , Mital, A. , Bakken, G. M. , 
Asfour, S. S. , and Bethea, N. J. , “ Development of strength 
capacity norms for manual materials handing activities: The 
state of the art. " Human Factors, June 1980, Vol. 22, p. 
271 - 283. Copyright 1980 by the Human Factors Society, Inc. 
and reproduced by permission. 


2.73 钢 轴 的 质量 . fr W. Edwards Deming fj i 


全 
Ë x 
" Making Things Right" 中 讨论 了 统计 在 工业 产品 质 量 


描述 性 统计 m 





控制 中 的 作用 ”. 一 个 例子 是 Deming 检查 了 一 家 钢 的 区 间 内 . 根据 图 形 , 是 否 有 证 据 支 持 这 个 观 
轴 制 造 厂 质量 控制 过 程 . 如 果 生 产 的 钢 轴 直径 小 于 点 ? 说 明 原 因 . 
1 em, 那么 在 轴承 里 就 显得 太 松 , 最 终 基本 上 必须 I LSL 


拒 收 ( 扔 掉 ). 为 了 确定 生产 钢 轴 机 器 设置 的 直径 是 100 — 
TEH, 从 每 天 的 产品 中 抽取 S00 8824838, 并 记录 
它们 的 直径 . 下 图 给 出 了 一 天 产品 的 500 个 直径 分 
fi. 图 中 符号 LSL 表示 钢 轴 直径 规格 的 1 cm 下限. 


a， 图 中 描述 的 是 什么 类 型 数据 , 定量 的 还 是 定性 的 ? Ë F1 
b. 用 于 描述 数据 的 是 什么 类 型 的 图 法 ? 50. 
c. 利用 图 形 估计 钢 轴 直 径 在 1. 0025 和 1. 0045 cm 

之 间 的 比例 . 


d. 可 能 存在 一 些 检查 人 员 , 由 于 不 清楚 直径 尺寸 

不 足 的 钢 轴 对 后 面 生产 过 程 造 成 的 麻烦 , 因此 

这 些 检 查 人 员 可 能 会 通过 一 些 比 钢 轴 直 径 规定 下 0 / 0995 0358 1.000 1.002 1.004 1.006 1.008 

限 还 低 的 钢 轴 , 将 它们 记录 在 以 1.000 em 为 中 心 直径 (cm) 
活动 中 的 统计 学 : 阿拉 巴 马 州 田 纳西 河中 污染 鱼 的 特征 

回顾 (第 1 章 , 活动 中 的 统计 学 ) 美 国 陆军 工兵 部 队 的 工程 师 搜 集 位 于 阿拉 巴 马 州 田纳西 河岸 附 
近 的 化 学 工厂 排放 的 有 毒物 质 造 成 鱼 污染 数据 . 生态 学 家 担心 污染 鱼 从 河口 迁移 到 附近 的 水 库 和 墅 
生动 物 保护 区 , 对 以 鱼 为 食物 的 其 他 野生 动物 构成 威胁 . 

对 捕 到 的 144 RE, 测量 以 下 变量 : 种 类 (海峡 鲜 鱼 、 大 嘴 钙 鱼 以 及 小 口 胭 脂 鱼 ) 、 捕 到 鱼 的 河 
流 /支流 (田纳西 河 、 弗 林 特 支流 、 石 灰 石 支流 、 春 天 支流 ) 、 重 量 (g) 、 长 度 (em)、DDT 污染 程度 (每 
百 万 分 之 一 ). 数据 保存 在 DDT 文件 中 . 

研究 目的 之 一 是 描述 捕 到 的 鱼 的 特征 . 一 些 必须 回答 的 关键 问题 是 : 不 同 种 类 的 鱼 最 有 可 能 在 
哪里 捕 到 ( 即 什 么 河流 或 支流 ), 鱼 的 典型 重量 和 长 度 是 多 少 ? 鱼 的 DDT 污染 程度 是 多 少 ? 污染 程 
度 会 随 着 种 类 而 变化 吗 ? 应 用 这 一 章 的 描述 性 方法 , 这 些 问题 可 以 得 到 部 分 回答 . 当然 , 使 用 的 方 
法 依赖 于 分 析 的 变量 类 型 (定量 还 是 定性 ). 

首先 考虑 定性 变量 的 种 类 , 图 SIA2. 1 是 由 用 SAS 产生 的 种 类 条 形 图 . 你 可 以 看 到 , 捕 到 的 鱼 主 
要 是 海峡 铃 鱼 ( 约 67% ) , 另外 有 25% 是 小 口 胭脂 鱼 , 8% 是 大 嘴 鲈 鱼 . 为 了 确定 这 些 鱼 是 在 什么 地 
方 捕 到 的 , 观察 由 MINITAB 产生 的 饼 图 , 见 图 SIA2. 2, 这 是 根据 4 条 河流 /支流 产生 的 4 个 饼 图 . 在 
支流 (LC, SC 或 FC) 捕 到 的 鱼 只 有 一 种 海峡 鲍鱼 . 由 于 这 些 支流 靠近 水 库 和 野生 动物 保护 区 , 生态 
学 家 重点 研究 以 海峡 鲍鱼 为 食物 的 野生 动物 . 
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图 SIA2. 1 鱼 种 类 的 SAS 水 平 条 形 图 
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O 来 自 Tanur, J. , et al. , eds. Statistics; 4 Guide to the Unknown. San Francisco: Holden-Day , 1978. p. 279 -281. 
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图 SIA2.2 各 河流 的 鱼 种 类 的 MINITAB hire 
SIA2. 3 是 这 些 统计 基 的 SAS 打印 输出 . XE IC AE fa, gx deze 00777; P BJ MINITAB 输出 见 图 


SIA2. 4. 这 些 直方 图 都 是 呈 丘 形 的 , 海峡 铃 鱼 的 长 度 和 重量 直方 图 !! ' 村 称 分 布 . 因此 ， 我 们 可 以 
应 用 经 验 法 则 去 描述 这 些 分 布 . 





The MEANS Procedure 
N 
SPECIES Übs Variable Mean Std Dev Minimum Max imum Median 
CCATFISH 36 LENGTH 44.7291667 4.5808047 29.5000000 52.0000000 45.0000000 
HEIGHT 987.2916667 262.6813926 353.0000000 1770.00 983.5000000 
DDT 33.2993750 119.4746053 0.7400000 1100.00 9.5500000 
LMBASS 12 LENGTH 26.5416667 4.4735410 17.5000000 36.0000000 26.2500000 
. WE IGHT 629.0000000 324.7564122 173.0000000 1433.00 538.0000000 
DDT 1.3800000 2.0426142 0.1100000 7.4000000 0.5300000 
SMBUFFñL 36 LENGTH 43.1250000 5.4134423 32.5000000 52.0000000 46.0000000 
WE IGHT 1356.42 436.7343995 520.0000000 2302.00 1440.50 
DDT 8.1616667 11.2832608 0.2500000 48.0000000 4.6500000 














图 SIA2.3 各 种 鱼 的 SAS 描述 性 统计 量 


对 于 海峡 鲍鱼 的 长 度 , y=44.73, 5 =4.58. 因此 , 大 约 95% 的 海峡 铃 鱼 长 度 在 区 间 44.73 +2 
(4. 58) 内 ， 即 在 35. 57 和 53. 89 cm 之 间 . 对 于 海峡 鲍鱼 的 重量 , 7 =987.3, 5 = 262.7. 这 表示 大 约 
”95% 的 海峡 铃 鱼 的 重量 落 在 区 间 987. 3 +2(262.7) 内 ， 即 在 461. 9 301512. 7 g ZÈ). 

图 SIA2. 4 最 下 面 的 直方 图 表示 海峡 铃 鱼 的 DDT 水 平 高 度 右 偏 ， 偏 度 是 几 个 非常 大 的 DDT 值 引 
起 的 . 图 SIA2. 3 的 SAS 输出 给 出 了 最 大 的 DDT 值 是 1 100 ppm. 这 个 值 是 一 个 异常 值 吗 ?对 于 海峡 
86:89 DDT 水平 , y=33.3, s=119.5, 因此 这 个 DDT 大 值 的 z 得 分 是 z= (1100 - 33.3)/119.5 = 
8.93. 由 于 在 一 个 数据 集中 观测 到 一 个 距离 均值 几乎 9 个 标准 差 的 点 是 极 不 可 能 的 . 因此 , 这 个 DDT 
值 是 一 个 高 度 疑似 的 异常 值 . 美国 陆军 工兵 部 队 的 研究 表明 这 个 DDT 值 测量 和 记录 都 是 正确 的 ,这 
条 鱼 恰 好 是 在 制造 厂 排放 有 毒物 质 的 水 域 捕 到 的 为 数 不 多 的 几 条 之 _- 因此 , 研究 者 决定 把 这 个 观 
测 值 从 数据 集中 剔除 ,重新 分 析 海 峡 铃 鱼 的 DDT 水 平 . 
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图 SIA2.4 ”海峡 鲍鱼 的 MINITAB 直方 图 


图 SIA2. 5 的 MINITAB 输出 给 出 了 剔除 异常 值 后 DDT 水 平 的 概括 统计 量 , 现在 y=22.1, s= 
46. 8. 根据 切 比 雪夫 法 则 , 至 少 有 75% 海 峡 鲍 鱼 的 DDT 水 平 将 会 落 在 区 间 22. 1 +2(46.8), 即 在 0 ~ 
115.7 ppm 之 间 . 图 SIA2. 6 是 删 减 后 数据 的 SAS 直方 图 , 这 个 图 表明 大 部 分 DDT 水 平 超过 了 5 


ppm 一 一 环境 保护 署 认为 是 安全 的 、 最 高 的 水 平 , 这 为 生态 学 家 重点 研究 以 海峡 鲍鱼 为 食物 的 野生 
动物 提供 了 进一步 的 证 据 . 





Descriptive Statistics: DDT 


Variable N Mean StDev Minimum Median Maximum 
DDT 95 22.07 46.84 0.740 9.40 360.00 





图 SIA2. 5 剔除 异常 值 后 海峡 锥 鱼 的 DDT 水 平 的 MINITAB 概括 统计 量 
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图 SIA2.6 ”剔除 异常 值 后 海峡 铃 鱼 的 DDT 水 平 的 SAS 直方 图 
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第 3 章 概 率 
目标 简要 介绍 概率 理论 , 提出 概率 在 统计 推断 中 的 作用 . 


3.1 概率 在 统计 学 中 的 作用 


如 果 你 玩 扑克 一 一 一 种 流行 的 赌博 游戏 , 在 任意 一 局 游戏 中 , 是 否 获胜 是 一 件 不 确定 的 事 . 类 
似 地 , 投资 一 个 石油 开采 公司 , 它 的 成 功 是 不 确定 的 , 也 是 一 个 风险 事件 . (事实 上 , 有 些 人 会 认为 ， 
投资 是 一 种 知识 性 赌博 形式 , 即 知 识 、 经 验 以 及 好 的 判断 可 以 增加 成 功 的 机 会 . ) 

与 玩 扑克 和 投资 非常 类 似 , 基于 样本 数据 作出 的 推断 也 是 不 确定 的 . 一 个 样本 很 少 能 够 给 出 它 
所 来 自 总 体 的 一 个 完美 精确 的 氢 述 . 当 利用 样本 数据 估计 拥护 某 个 政治 候选 人 或 者 喜欢 某 种 消费 品 
的 人 群 比例 时 , 总 是 存在 一 定 范围 内 的 误差 (就 像 民 意 调查 结果 告诉 我 们 的 一 样 ). 类 似 地 , 从 装配 
线 上 选择 的 橡胶 模型 补偿 器 , 它 的 平均 直径 的 样本 估计 会 偏离 总 体 真 值 多 远 总 是 不 确定 的 . 因此 ， 
关于 估计 的 不 确定 程度 的 度量 (在 第 1 章 中 , 我 们 称 之 为 推断 的 可 靠 性 ) 在 统计 推断 中 扮演 着 主要 的 
角色 . 

我 们 怎样 度量 有 关 事 件 的 不 确定 性 呢 ? 每 天 收看 新 闻 联播 的 人 都 能 回答 这 个 问题 , 答案 是 概 
率 . 例如 ,新 闻 报道 某 一 天 降雨 的 概率 为 20%. 这 种 说 法 指出 那天 是 否 下 雨 是 不 确定 的 , 3 H SUR B 
度量 出 现下 雨 的 可 能 性 为 20%. 

概率 在 决策 中 也 有 重要 作用 . 假定 你 有 机 会 投资 一 家 石油 开采 公司 . 过 去 记录 显示 , 对 于 10 次 
以 前 的 石油 钻探 (公司 过 去 的 样本 ), 所 有 的 结果 都 是 干 井 . 你 得 出 什么 结论 ? 你 是 否 会 认为 这 个 公 
司 要 比 以 50-50 找到 生产 井 的 公司 有 更 好 的 机 会 ? 你 应 该 投资 这 个 公司 吗 ? 我 们 认为 你 对 这 些 问题 
的 答案 应 是 “断然 否定 ”. 如 果 公司 的 开采 能 力 有 50% 的 时 候 可 以 找到 一 个 生产 井 , 那么 10 次 钻探 产 
出 10 个 干 井 的 记录 是 一 个 太 不 可 能 的 事件 . 你 同意 吗 ? 

本 章 , 我 们 将 探讨 概率 的 意义 , 给 出 一 些 在 统计 学 研究 中 有 用 的 概率 性 质 . 


3.2 事件 、 样 本 空间 和 概率 


我 们 先 从 容易 说 明 的 简单 例题 开始 讨论 概率 , 不 讨论 任何 可 能 使 人 糊涂 的 内 容 . 借助 于 简单 的 
例题 , 介绍 重要 的 定义 , 概率 的 概念 也 就 比较 容易 提出 了 . 

假定 投 毛 一 次 硬币 ,记录 正面 朝 上 的 结果 ， 这 是 一 次 观测 , 或 一 个 测量 值 . 任何 一 个 获得 或 产生 
观测 值 的 过 程 称 作 一 次 试验 . 我 们 的 试验 定义 要 比 自然 科学 里 所 用 的 广泛 , 自然 科学 中 , 你 可 能 看 
到 的 是 试管 、 显 微 镜 等 . 另外 ， 统计 试验 的 更 多 实例 是 记录 一 位 顾客 是 否 偏 好 两 种 笔记 本 电脑 品牌 
中 的 一 个 、 选 民 关于 一 个 重要 环境 问题 的 观点 、 度量 一 条 污染 的 河流 中 氧气 含量 、 观测 螺纹 钢 的 断 
裂 强度 、 软 件 代码 中 错误 个 数 ， 以 及 观测 被 一 种 新 的 杀 虫 剂 杀害 的 昆虫 的 比例 . 还 可 以 继续 列 出 更 
多 的 统计 试验 , 但 重要 的 是 我 们 的 试验 定义 是 很 广泛 的 . 

定义 3.1 试验 是 获得 一 个 观测 或 进行 一 次 测量 的 过 程 . 

考虑 另外 一 个 简单 试验 ， BEN —BUSCTOR E XUCRRCT- i E89 RC. 这 个 试验 的 6 个 基本 可 能 结 
果 为 : 


K x 47 





.观测 到 1. 
.观测 到 2. 
， 观 测 到 3. 
.观测 到 4. 
观测 到 5. 
.观测 到 6. 

注意 , 如 果 这 个 试验 做 一 次 , 则 你 能 观测 到 一 个 结果 ,并 且 只 能 是 这 6 个 基本 结果 中 的 一 个 . 这 
些 结果 的 不 同 之 处 在 于 , 这 些 可 能 性 不 能 分 解 成 任意 其 他 的 结果 . 试验 的 这 些 最 基本 的 可 能 结果 称 
作 简单 事件 . 

定义 3.2 简单 事件 是 一 个 试验 的 基本 结果 ，, 它 不 能 分 解 为 更 简单 的 结果 
EEN 投掷 两 枚 硬币 ,记录 两 枚 硬币 朝 上 的 面 . 列 出 这 个 试验 的 所 有 简单 事件 . 

f 即使 对 于 一 个 看 起 来 很 微不足道 的 试验 , 我 们 在 列举 简单 事件 时 也 必须 小 心 . 首先 快速 地 
给 出 基本 事件 为 观测 到 两 个 正面 、 观 测 到 两 个 反面 、 观测 到 一 个 正面 和 一 个 反面 . 但 是 , 进一步 思考 
发 现 最 后 一 个 , 即 观测 到 一 个 正面 和 一 个 反面 可 以 分 解 为 硬币 1 为 正面 、 硬币 2 为 反面 以 及 硬币 1 


为 反面 、 硬币 2 为 正面 9. 因此, 简单 事件 为 : 


l. 观测 到 HH. 

2. 观测 到 HT. 

3. 观测 到 TH. 

4. 观测 到 TT. 
(其 中 第 一 个 位 置 的 五 意味 着 “硬币 1 
为 正面 ", 第 二 个 位 置 的 五 意味 着 “ 硬 
币 2 为 正面 ”， 等 等 ) 

我 们 常常 希望 考虑 一 个 试验 的 所 
有 简单 事件 集合 , 我 们 称 这 个 集合 为 
试验 的 样本 空间 . 例如 ,相应 于 投掷 蜗 
子 试验 的 样本 空间 有 6 个 简单 事件 . 表 
3.1 列 出 了 至 今 所 讨论 的 试验 的 样本 
空间 . 

定义 3.3 试验 的 样本 空间 是 所 
有 简单 事件 的 集合 

就 像 图 形 在 描述 数据 集 时 是 有 用 
的 一 样 , 用 图 示 法 描述 样本 空间 及 其 
简单 事件 通常 也 是 有 用 的 . 图 3. 1 给 出 
了 表 3. 1 中 每 个 试验 的 图 示 . 每 种 情况 
F, 样本 空间 呈现 为 一 个 封闭 的 图 形 ， 





表 3.1 试验 和 样本 空间 


试验 : 投掷 一 枚 硬币 ,观测 朝 上 的 面 
样本 空间 : 1. 观测 到 正面 
2. 观测 到 反面 
这 个 样本 空间 可 以 表示 为 包含 两 个 简单 事件 的 集合 : 
S:{H, T} 
其 中 总 表示 观测 到 正面 的 简单 事件 , 了 表示 观测 到 反面 的 简单 事件 . 





Au 38 — BUBR-F- , 观测 朝 上 的 面 

样本 空间 : 1， 观 测 到 ! 

2. 观测 到 2 

3. 观测 到 3 

4. 观测 到 4 

5 观测 到 5 

6. 观测 到 6 

这 个 样本 空间 可 以 表示 为 包含 6 个 简单 事件 的 集合 : 

l 


$7575. d3 





试验 : TEPORE TD, ， 观 测 朝 上 的 面 
样本 空间 : 1. 观测 到 HH 

2. 观测 到 HT 

3. 观测 到 TH 

4. 观测 到 TT 


这 个 样本 空间 可 以 表示 为 包含 4 个 简单 事件 的 集合 ， 
S:|HH, HT, TH, TT} 
| 


〇 ”即使 硬币 在 外 观 上 是 相同 的 , 事实 上 , 它们 也 是 两 个 不 同 的 硬币 . 因此 , 指定 一 个 硬币 为 “硬币 1” 及 男 一 个 为 “硬币 2” 


在 任何 情况 下 是 合理 的 . 


A 
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记 为 5, 包含 一 个 称 作 样本 点 的 点 集 , 每 个 点 代表 一 个 简单 事件 . 注意 , 样本 空间 S 中 的 样本 点 个 数 
等 于 与 各 次 试验 相关 的 简单 事件 的 个 数 , 分 别 为 : 投 拨 一 枚 硬币 有 两 个 样本 点 , BEBE BHEE 6 
个 样本 点 , 投掷 两 枚 硬币 有 4 个 样本 点 . 这 些 图 形 表示 称 作 维 恩 ( Venn) 图 . 














a) 试验 ， 观测 一 枚 硬币 朝 上 面 b) 试验 : 观测 一 颗 般 子 朝 上 的 面 
e HH @ HT 
e TH e° TT 


S 





c) 试验 : 观测 两 枚 硬币 的 朝 上 面 
图 3.1 表 3.1 中 三 个 试验 的 维 恩 图 


现在 我 们 已 经 定义 简单 事件 为 试验 的 基本 结果 , 定义 样本 空间 为 所 有 简单 事件 的 集合 , 下 面 将 
讨论 简单 事件 的 概率 . MAER, 你 已 经 用 过 术语 概率 , 并且 对 它 的 意义 也 有 某 种 直观 的 理解 . 概率 
一 般 作为 “机 会 "、“ 可 能 性 "以 及 类 似 概念 的 同义词 , 我们 将 采用 这 些 非 正式 的 概念 来 讨论 概率 . 例 
如 , 如 果 投 掷 一 枚 均匀 的 硬币 ， 我 们 有 理由 相信 两 个 简单 事件 ( 即 观测 到 正面 以 及 观测 到 反面 ) 发 生 
的 机 会 是 一 样 的 . 因此 , 可 以 说 “观测 到 正面 的 概率 是 50% 或 1/2”， 也 可 以 说 “观测 到 正面 的 可 能 性 
是 50-50”. 

当 我 们 说 正面 的 概率 是 1/2 时 , 这 意味 着 什么 ? 意味 着 在 投掷 次 数 非 常 多 的 过 程 中 ， 大 约 将 有 
一 半 会 出 现 正面 . 因此 , 数字 1⁄2 度量 了 在 一 次 单独 的 投掷 中 , 观测 到 正面 的 可 能 性 . 

观测 到 正面 的 概率 是 1/2, 并 不 意味 着 在 多 次 投掷 中 , 恰好 有 一 半 出 现 正面 . 例如 ， 我 们 不 能 期 
望 投掷 两 次 硬币 恰好 出 现 一 次 正面 , 或 者 投掷 10 次 硬币 恰好 出 现 5 次 正面 . 相反 ， 我 们 期 望 出 现 正 
面 的 比例 是 以 随机 方式 变化 的 , 并 且 随 着 投掷 次 数 逐 渐 增 加 , 越 来 越 接 近 于 出 现 正面 的 概率 1⁄2. 从 
图 3. 2 可 以 看 出 这 个 性 质 . 

图 3.2 给 出 了 在 一 个 模拟 投掷 硬币 试验 中 , 分别 重 复 n = 25, 50, 75, 100, 125, …，1450， 
1475, 以 及 1500 KE, 观测 到 正面 的 比例 . 图 形 的 水 平 轴 表 示 投 锤 的 次 数 ,出 现 正面 的 相应 比例 画 
E n 值 的 上 方 . 我 们 将 这 些 点 连接 起 来 以 强调 出 现 正面 的 比例 , 随 着 n 越 来 越 大 ( 随 着 移 向 图 的 右 
31), 越 来 越 接 近 于 O. 5. 

定义 3.4 —4 简单 事件 的 概率 是 进行 试验 时 度量 这 个 事件 将 会 发 生 的 可 能 性 的 一 个 数 . 当 试 
验 重 复 的 次 数 非常 多 时 ,概率 可 以 用 观测 到 的 简单 事件 的 次 数 的 比例 来 近似 全 . 对 于 一 个 简单 事件 
E, RAIE E WRA P(E). 

虽然 我 们 常 将 一 个 事件 的 概率 看 做 在 一 个 很 长 的 试验 序列 中 事件 发 生 次 数 的 比例 ， 但 是 有 些 试 
验 不 可 能 重复 . 例如 , 你 投资 一 个 石油 钻探 风险 , 投资 成 功 的 概率 是 某 个 未 知 值 ， 你 不 可 能 通过 反复 





O 这 个 结论 来 自 于 概率 论 中 的 一 个 叫做 大 数 定律 的 公理 . 通俗 地 说 ， 定律 表述 了 当 试验 被 不 斯 ( 即 很 多 次 ) 地 重复 进行 
时 ,一 个 结果 发 生 次 数 的 相对 频率 趋 近 于 这 个 结果 的 真实 (或 理论 ) 概率. 
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图 3.2 ”模拟 投掷 硬币 试验 中 , 观测 到 正面 的 比例 


试验 去 佑 算 这 个 值 . 这 个 事件 发 生 的 概率 是 某 个 不 为 我 们 所 知 的 数值 . 为 估计 它 的 值 , 我 们 所 能 做 的 
就 是 试图 确定 类 似 投资 成 功 的 比例 , 并 把 它 看 做 所 求 概率 的 一 个 近似 . 尽管 实际 中 我 们 可 能 不 会 重 
复试 验 , 概率 的 相对 频率 定义 直观 上 对 我 们 也 有 一 定 的 吸引 力 . 

不 管 你 怎样 为 一 个 试验 的 简单 事件 指派 概率 , 被 指派 的 概率 必须 遵循 下 面 给 出 的 两 条 法 则 (或 
公理 ). 





指派 简单 事件 概率 的 规则 
4 E, E, Ut, E, 表示 样本 空间 中 的 简单 事件 . 
l. 所 有 简单 事件 的 概率 必须 在 0 和 1 之 间 : 


O<P(E,) s1, i=1,2, =, k 
2. 样本 空间 中 所 有 简单 事件 的 概率 和 必 为 1 ; 
È PE) =1 











有 时 我 们 感 兴趣 的 是 任意 简单 事件 集合 . 例如 , 在 表 3. 1 BUDE RO rb, 我 们 可 能 会 对 观测 到 
货 子 的 奇数 点 感 兴趣 . 如 果 下 面 三 个 简单 事件 任意 一 个 发 生 , 则 上 面 的 情况 将 发 生 ， 

L 观测 到 1. 

2. 观测 到 3. 

3. 观测 到 5. 

事实 上 , 如 果 我 们 指定 表示 出 现 奇数 点 的 简单 事件 集合 , 那么 观测 到 奇数 点 事件 显然 是 确定 的 . 
这 种 简单 事件 的 指定 集合 称 作 事 件 . 

定义 3.5 ”事件 是 简单 事件 的 一 个 指定 集合 . 
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计算 一 个 事件 的 概率 , 即 是 它 包 含 的 简单 事件 的 概率 求 和 . 这 条 法 则 符合 概率 的 相对 频率 概念 ， 
如 例 3.2 所 阐述 . 
| | l 事件 的 概率 
事件 4 的 概率 等 于 事件 A 中 所 包含 的 简单 事件 的 概率 之 和 . 











考虑 投掷 两 枚 硬币 的 试验 . 如 果 硬 币 是 均匀 的 , 那么 与 简单 事件 关联 的 正确 概率 如 下 ， 
简单 事件 概率 简单 事件 概率 

















HH + TH + 
HT + TT T 
e HH e HH 
A B 
e TH e TH 
a) 事件 4 b) 事件 8 
图 3.3 说 明 事件 4 和 B 是 简单 事件 集合 的 撕 币 试验 
定义 如 下 事件 : 
A: {恰好 观测 到 一 个 正面 } 
B: | 至少 观测 到 一 个 正面 | 
计算 A 的 概率 以 及 B 的 概率 . 


解 注意 到 如 果 重 复 进行 很 多 次 投掷 硬币 的 试验 , 我 们 期 望 这 4 个 简单 事件 发 生 的 相对 频率 都 
近似 地 为 1/4, 因此 它们 有 相同 的 概率 . 由 于 当 两 个 简单 事件 HT 和 TH 中 的 任 一 个 发 生 时 , 事件 4: 
| 恰好 观测 到 一 个 正面 ;将 会 发 生 ( 见 图 3.3), 因此 在 重复 进行 多 次 试验 中 ,大约 有 1/4 +1/4 2172 
会 出 现 事 件 4. 这 种 简单 事件 的 相对 频率 的 可 加 性 与 我 们 计算 PCA) 的 法 则 是 一 致 的 ， 


P(A) =P(HT) + P(TH) = 二 P dl 
应 用 这 个 法 则 来 求 PCB) , 注意 到 事件 B 包括 简单 事件 HH, HT 以 及 TH,， 即 如 果 这 三 个 简单 事件 中 
的 任 一 个 发 生 , 则 8 将 发 生 . 因此 ， 





P(B) =P(HH) + P(HT) + P(TH) -i + 1-3 


4 4 
现在 我 们 可 以 将 计算 任意 事件 的 概率 概括 为 如 下 步骤 @ , 


计算 任意 事件 概率 的 步 
| L 定义 试验 ， 即 措 述 获得 观测 值 的 过 程 以 及 记录 的 观测 值 类 型. 
| 2. 定义 并 列举 简单 事件 . 











O 关于 这 个 主题 的 详细 研究 参考 Feller( 1968). 
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3. 对 简单 事件 指派 概率 . 
4. 确定 感 兴趣 事件 所 包含 的 简单 事件 集合 . 
5. 对 简单 事件 的 概率 求 和 ,获得 事件 的 概率 . 











DEN] uus cens P be ERA RS Hed, 即 生产 有 缺陷 产品 的 比率 比 
平时 更 高 . 在 我 们 学 习 的 现 阶段 , 还 没有 工具 解决 这 个 问题 , 但 是 我 们 可 以 说 影响 解决 方案 的 重要 
因素 之 一 是 装配 线 上 有 缺陷 产品 的 比例 . 说 明 在 装配 线 上 产品 有 缺陷 的 概率 是 多 少 ? 由 这 个 装配 线 
生产 的 下 两 个 产品 有 缺陷 的 概率 是 多 少 ? 对 于 一 般 上 个 产品 有 缺陷 的 概率 是 多 少 ?解释 你 如 何 解决 
这 个 问题 . 
解 
步骤 1 定义 试验 . 检查 单个 产品 的 试验 与 图 3. 1a 中 所 阐述 的 投掷 硬币 试验 的 基本 结构 是 一 样 
的 . 一 个 产品 , 或 是 没有 缺陷 的 ( 称 之 为 正面 ) 或 是 有 缺陷 的 ( 称 之 为 反面 ) 观测 并 且 
记录 它 的 生产 情况 . 
试验 ; 观测 单个 产品 的 生产 情况 . 
步骤 2 列 出 简单 事件 . 试验 只 有 两 种 可 能 的 结果 , 这 些 简 单 事件 为 : 
1. N: [产品 没有 缺陷 } 
2. Di | 产品 有 缺陷 } 
ERS 指派 简单 事件 的 概率 . 当 我 们 试图 确定 两 个 简单 事件 的 概率 时 , 这 个 问题 和 投 搓 硬 币 问 
题 之 间 的 差别 成 为 显然 . 指派 给 简单 事件 DD 的 概率 是 多 少 ? 有 些 人 可 能 会 说 0.5, Si 
投 挪 硬币 试验 一 样 , 但 是 你 可 以 看 到 求 简单 事件 p 的 概率 P( 也 ) 不 是 这 么 容易 的 . 假定 
装配 线 受 控 时 , 10% 的 产品 是 有 缺陷 的 . 那么 乍 看 之 下 , P(D) 好 像 是 0. 10. 但 这 可 能 是 
不 对 的 , 因为 装配 线 可 能 是 失控 的 , 会 以 更 高 的 比例 生产 有 缺陷 的 产品 . 因此 , FOIE 
意 的 重要 一 点 是 , 不 能 将 等 概率 指派 给 这 些 简 单 事件 . 我 们 怎样 求 这 些 概率 呢 ? 一 个 好 
的 方法 可 能 是 在 一 段 时 间 内 检查 装配 线 , 并 记录 下 缺陷 产品 和 无 缺陷 产品 的 个 数 . 然 
后 , 两 种 类 型 产品 的 比例 可 用 于 近似 两 个 简单 事件 的 概率 . 
这 样 , 我们 可 以 利用 第 4 步 和 第 5 步 计算 任 何 感 兴趣 的 有 两 个 简单 事件 的 试验 概率 . 
除了 简单 事件 的 概率 不 一 样 以 外 , 评估 两 个 产品 生产 情况 的 试验 与 例 3. 2 投掷 两 枚 硬 
币 的 试验 是 相同 的 . 我 们 将 学 习 怎样 求 这 个 试验 的 简单 事件 的 概率 , 对 于 一 般 的 天 个 产 
. 品 的 情况 ,， 见 3. 6 节 . 
EEZ 软件 工程 师 必 须 从 5 个 需要 检测 缺陷 代码 的 程序 模块 中 选择 3 个 . 如 果 软 件 工程 师 并 不 知 
道 调试 这 些 模块 所 需 的 时 间 是 不 同 的 , 那么 下 面 的 概率 分 别 为 多 少 ? 
a 工程 师 选择 调试 所 需 时 间 最 少 的 2 个 模块 ? 
b. 工程 师 选择 调试 所 需 时 间 最 多 的 3 个 模块 ? 
解 
步骤 1 试验 是 从 5 个 需要 调试 的 模块 中 选择 3 个 . 
步骤 2 我 们 将 调试 的 模块 记 作 Wi ，M2 =, Ms, 其 中 M, 表示 调试 所 需 时 间 最 少 的 模块 ，M。 
表示 调试 所 需 时 间 最 多 的 模 抉 . M.M; 表示 选择 模块 M, 和 M.. 例如 ,MM 表示 选择 模 
BM, AI M3. 那么 和 这 个 试验 相关 的 10 个 简单 事件 如 下 


3 
w 
wh 
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简单 事件 ”概率 简单 事件 概率 

M.M,M, 市 M,M,M; E 
1 1 

M,M,M, 10 M,M,M, 10 

M,M,Ms 市 Ma M3 Ms m ` 
1 1 

M,M,M, 10 M,M,M; 10 

M1 Ms Ms i Ms Ma Ms 市 

PRI 如 果 我 们 假设 选择 任意 3 个 模块 的 可 能 性 都 是 相同 的 , 这 10 个 简单 事件 的 概率 都 是 


1/10. 
步骤 4 定义 事件 4 和 8B 如 下 : 
A: {工程 师 选 择 调试 所 需 时 间 最 少 的 2 个 模块 
B: {工程 师 选 择 调试 所 需 时 间 最 多 的 3 个 模块 } 
对 任何 选择 了 M, 和 M, 模块 的 简单 事件 ， 即 3 个 简单 事件 MM, M, M, M.M, 以 及 
M,M,Ms, 事件 A 就 会 发 生 , 类 似 地 , 事件 B 由 单个 事件 M3M4Ms 组 成 . 
PRS 我 们 现在 将 事件 4 和 8B 中 的 简单 事件 的 概率 相 加 可 以 得 到 
1 1 3 


1 


以 及 
P(B) -P(M,M,M;) = rra 


[ 注 : 对 迄今 为 止 所 讨论 的 试验 , 列 出 简单 事件 是 很 容易 的 . 对 于 更 复杂 的 试验 , 简单 事件 的 个 
数 可 能 非常 大 , 以 至 于 将 它们 都 列 出 来 是 不 切实 际 的 . 在 解决 包含 许多 简单 事件 试验 的 概率 问题 中 ， 
我 们 利用 与 包含 个 简单 事件 的 试验 同样 的 原则 . 唯一 的 区 别 是 为 了 确定 简单 事件 的 个 数 , 我 们 需 
要 计数 法 则 ,而 不 是 将 它们 都 列 出 来 . 在 3.8 节 , 我 们 给 出 了 一 些 更 有 用 的 计数 法 则 . J 








应 用 练习 ( 续 ) 
3.1 有 毒 的 化 学 事件 . Process Safety Progress ( 2004 位 置 事件 的 百分比 
年 9 月 ) 报 道 了 台湾 有 毒化 学 物质 事件 的 一 个 紧急 化 工厂 21% 
反应 系统 . 自从 2000 年 实施 以 来 , 这 个 系统 已 经 记 "nn - 
录 了 250 多 个 事件 . 下 表 给 出 了 这 些 有 毒化 学 事件 
发 生地 点 的 一 个 详细 分 类 . 考虑 台湾 有 毒化 学 事件 其 他 12% 
的 发 生 位 置 . 总 计 100% 





a. 列 出 这 个 试验 的 简单 事件 . 


、 资料 来 源 : Chen, J. R. , et al. “Emer f toxi 
5b， 对 这 些 简单 事件 指派 合理 的 概率 . al mergency response of toxic 


chemicals in Taiwan: The system and case studies. ” Process 








e 在 学 校 试验 室 发 生 事件 的 概率 是 多 少 ? Safety Progress, 第 3 期 23 卷 , 2004 年 9 月 (图 5a). 
位 置 事件 的 百分比 3.2 海滩 侵蚀 热 区 . 参考 练习 2. 3, 美国 陆军 工兵 部 
学 校 试验 室 6% 队 关于 高 侵蚀 率 ( 即 海滩 热 区 ) 海 滩 的 研究 . 6 个 海 


运输 途中 26% 滩 热 区 的 数据 重新 列 于 下 面 的 表 中 : 














概 x 3 
m (2) 
WAAK BAE MaR (E 抱怨 者 0.24 
没有 沙丘 “单一 , 海 资料 来 源 : The Orange County( 加利福尼亚 ) Reporter, 1990 
Miami Beach, FL /平坦 BR 4 年 8 月 7 日 
没有 沙丘 a 列 出 这 个 试验 的 简单 事件 . 
Coney Island, NY /平坦 其 他 13 b. 为 简单 事件 指派 合理 的 概率 . 
MEME 单 _， 海 c. 求 消费 者 是 非 绿色 者 或 抱怨 者 的 概率 . 
Surfside ，CA /平坦 EX 35 d. 求 消费 者 以 某 种 方式 支持 环境 主义 ( 即 消费 者 
是 真诚 绿色 者 , 钞票 绿色 者 或 者 新 绿色 者 ) 的 
d 单一 沙丘 PH 没 估计 概率 . 
; 3.4 管理 系统 的 失效 . 参考 练习 2.4，Process Safety 
Ocean City, NJ 单一 沙丘 其 他 没 估计 Progress( 2004 年 12 月 ) 关 于 由 管理 系统 失效 造成 
Spring Lake, NJ ” 没 观 测 PH 14 的 83 个 工业 事故 的 研究 . 将 这 83 个 事故 发 生 的 根 





TCR A. “Identification and characterization of erosional 
hotspots". William & Mary Virginia Institute of Marine Sci- 
ence, 美国 陆军 工兵 部 队 项 目 报告 2002 4p 3 月 
18 日 . 


a 假设 记录 了 每 个 海滩 热 区 的 近 滨 堤 坝 条 件 . 给 
出 这 个 试验 的 样本 空间 . 

b. 求 a 的 样本 空间 的 简单 事件 概率 . 

海滩 热 区 的 近 滨 堤 坝 条 件 为 平坦 或 单一 海岸 平 
行 的 概率 是 多 少 ? 

.现在 假定 记录 了 每 个 海滩 热 区 的 海滩 条 件 . 请 
给 出 这 个 试验 的 样本 空间 . 

e. R d 中 样本 空间 的 简单 事件 的 概率 . 

f 一 个 热 区 的 海滩 条 件 不 是 平坦 的 概率 是 多 少 ? 

.3 环境 分 类 . 环境 工程 师 基 于 消费 者 对 环境 的 感 
觉 将 美国 的 消费 者 分 成 5 类 : 

非 绿色 者 宣称 他 们 没有 知识 来 理解 环境 问题 . 

.真诚 绿色 者 利用 生物 降解 产品 . 

.钞票 绿色 者 用 另 一 种 燃料 支持 需求 的 新 车 . 

.新 绿色 者 经 常 性 地 回收 再 利用 报纸 . 

. 抱 忽 者 相信 工业 , 而 不 是 个 人 , 可 以 解决 环境 
问题 . 

下 面 的 表 列 出 了 各 类 消费 者 所 占 的 比例 . 假定 随 

机 选择 一 名 美国 消费 者 , 确定 他 (她 ) 对 环境 的 

感觉 . 

一 一 一 一 


° 


e 


Q + Q PN o — 


非 绿色 者 0.28 
真诚 绿色 者 0.11 
钞票 绿色 者 0.11 
新 绿色 者 0.26 





Uo 


本 原因 重新 列 于 下 表 . 





管理 系统 原因 分 类 事故 的 个 数 
工程 和 设计 27 
程序 和 实践 24 
FEB TIN Z 22 
训练 和 交流 10 

总 计 83 


1—0] 
资料 来 源 : Blair, A. S.“ 由 美国 化 学 安全 部 和 哈佛 调研 部 
调查 的 关于 事故 中 出 现 的 管理 系统 失效 . ”Process Safety 
Progress, 2004 年 12 月 第 4 期 23 卷 ( 表 1). 


a_ 求 出 并 解释 一 个 工业 事故 是 由 工程 和 设计 的 疏 
忽 造 成 的 概率 . 

b. 求 出 并 解释 一 个 工业 事故 是 由 除 程序 和 实践 的 
玖 忽 外 的 某 些 原因 造成 的 概率 . 


.5 地 下 井 水 的 污染 . 参考 练习 2. 10, Environmental 


Science & Technology(2005 年 1 H ) 关 于 美国 新 罕 布 
什 尔 州 并 中 甲 基板 丁 基 醚 (MTBE ) 污染 的 研究 . 收 
RT 223 口 井 的 样本 数据 , 保存 在 MTBE 文件 中 . 
回顾 每 口 井 的 分 类 是 按照 井 的 类 型 (公共 或 私有 ) ` 
苹 水 层 ( 基 岩 或 松散 ) 和 MTBE 的 检测 水 平 ( 低 于 限 
制 或 检 出 ). 

a 考虑 一 个 试验 , 观测 井 的 类 型 、 鞭 水 层 和 MT- 
BE 的 检测 水 平 . 列 出 这 个 试验 的 简单 事件 . 
(提示 : 其 中 一 个 简单 事件 是 私有 / 基 岩 / 低 于 
限制 . ) 

b， 利 用 统计 软件 求 每 个 简单 事件 结果 中 包含 的 
223 口 井 的 个 数 . 然后 利用 这 个 信息 计算 简单 事 
件 的 概率 . 
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3 


w 


c. 求 出 并 解释 一 口 井 有 MTBE 的 检 出 水 平 的 
概率 . 

6 USDA 鸡 的 检查 . 美国 农业 部 (USDA ) 发 布 了 在 

它 的 标准 检查 系统 下 , 每 100 只 宰杀 的 鸡 中 有 1 只 

检 出 了 排泄 物 污 染 . (Tampa Tribune, 2000 年 3 月 

31 H.) 

a， 如 果 选 择 一 只 宁 杀 的 鸡 , 它 检 出 排 泄 物 污染 的 
概率 是 多 少 ? 

b. a 中 的 概率 是 基于 一 项 USDA 的 研究 ， 即 32 075 
只 鸡 中 有 306 只 检 出 了 排泄 物 污染 . 你 同意 US- 
DA 关于 字 杀 的 鸡 中 检 出 排泄 物 污染 可 能 性 的 
论断 吗 ? 


-7 山 毛 样 树 林木 中 的 真菌. 欧洲 中 东部 的 山 毛 样 


树 森 林 正 在 遭受 士 地 所 有 权 和 经 济 剧变 的 动态 变 
化 威胁 . 匈牙利 大 学 的 教授 在 Applied Ecology and 
Environmental Research ( 2003 年 第 1 卷 ) 上 评价 了 这 
个 地 区 的 山 毛 样 树种 类 的 现状 . 在 被 调查 的 188 EE 
山 毛 样 树 中 , 49 棵 受到 了 真菌 的 损害 . 由 于 真菌 的 
种 类 不 同 , 损害 发 生 在 树干 、 树 枝 或 者 树叶 上 . 在 
被 损害 的 树 中 , 有 85% 树 干 受到 影响 , 10% 树 叶 受 
到 影响 , 5% 树 枝 受 到 影响 . 
a 给 出 欧洲 中 东部 的 一 棵 山 毛 样 树 受 到 真菌 损害 
的 概率 的 合理 估计 . 
b. 选取 一 棵 受到 真菌 损害 的 出 毛 样 树 ， 并且 观 
测 影响 区 域 (树干 、 树 叶 或 者 树枝 ). 列 出 这 
个 试验 的 样本 点 并 计算 每 个 样本 点 的 合理 


.8 本 福 德 的 数字 定律 . 参考 练习 2.7, American 


Scientist( 1998 年 7-8 月 ) 关 于 本 福 德 定律 的 研究 . 
回顾 本 福 德 定律 阐述 了 在 一 个 随机 选择 的 数字 中 ， 
整数 1 比 其 他 整数 更 可 能 作为 第 一 个 有 效 数字 . 下 
面 的 表 汇 总 了 743 个 大 学 新 生 随机 选择 一 个 6 位 
数 的 研究 结果 . 假定 选择 这 743 个 数 中 的 一 个 并 且 
观测 第 一 个 有 效 数字 . 

a. 列 出 这 个 试验 的 样本 点 . 

b. 解释 为 什么 样本 点 不 等 可 能 地 出 现 . 

c. 指派 样本 点 的 概率 . 证 明 概 率 之 和 为 I. 

d. 首位 有 效 数字 是 1 或 2 的 概率 是 多 少 ? 


3.3 复合 事件 


3.10 





首位 数字 发 生 个 数 
1 109 
2 75 
3 77 
4 99 
5 72 
6 117 
7 89 
8 62 
9 43 

总 计 743 


资料 来 源 : Hill, T. P.“ 首 位 数字 现象 ”American Scientist , 
第 86 3$, 第 4 期 , 7-8 月, 1998 年 , 第 363 页 (图 3). 


3.9 老年 性 病 采 的 基因 研究 . 科学 家 已 经 发 现 了 由 


于 变异 造成 老年 性 痢 呆 症 早 期 发 作 的 两 个 基因 (位 

于 第 19 和 21 个 染色 体 上 ). Science News(1995 年 7 

H8 日) 刊登 了 有 关 和 寻找 导致 老年 性 痴呆 第 三 个 基 

因 的 研究 . 一 个 国际 科学 家 组 织 收 集 了 21 个 受 此 

早期 发 病 方 式 疾病 困扰 的 家 庭 基因 信息 . 这 些 家 庭 

中 有 6 个 在 染色 体 14 上 的 S182 基因 发 生 了 变异 ， 

这 解释 了 老年 性 痴呆 症 的 早期 发 作 现 象 . 

a. 考虑 受 老年 性 痴呆 症 早期 发 作 困扰 的 家 庭 , R 
研究 者 发 现 这 个 家 庭 的 第 14 条 染色 体 上 的 
S182 基因 发 生变 异 的 近似 概率 . 

b. 讨论 a 中 概率 的 可 靠 性 . 怎样 才能 获得 一 个 更 精 

确 的 概率 估计 ? 

混凝土 的 电阻 . 由 于 消除 了 极 化 影响 及 电容 阻 

抗 导致 的 困难 , 开发 了 一 种 测量 混凝土 电阻 的 改进 

方法 (Magazine of Concrete Research, 1985 年 12 月 ). 

这 个 方法 对 不 同 的 水 -水 泥 混合 的 混凝土 样品 进行 

测试 , 检查 了 3 种 不 同 的 水 重量 比例 (40% , 45% 以 

及 50% ) 以 及 三 种 不 同 的 水 泥 混合 度 (300 kg/m’, 

350 kg/m? 以 及 400 kg/m! ). 

a. 列 出 这 个 试验 水 重量 比 和 水 泥 混 合 度 的 所 有 可 
能 组 合 . 

b. 假定 我 们 确定 了 导致 最 高 电阻 的 水 重量 比 和 水 
泥 混 合 度 的 组 合 . 在 进行 试验 之 前 , 应 该 为 简单 
事件 指派 相等 概率 吗 ?9 为 什么 ? 


一 个 事件 常 可 看 作 两 个 或 更 多 事件 的 组 合 . 这 种 事件 称 作 复合 事件 ; 它们 可 以 用 两 种 方法 形成 
(复合 ). 
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定义 3.6 两 个 事件 4 和 媒 的 并 是 在 一 次 单独 试验 中 , 若 事 件 4 或 事件 BB 或 事件 4 和 B 同时 发 
生 ， 它 将 会 发 生 的 一 个 事件 . 我 们 将 事件 4 和 事件 已 的 并 记 作 4UB. 
AUB=A 58 B 
定义 3.7 事件 4 和 B 的 交 是 在 一 次 单独 试验 中 , 若 4 和 B 同 时 发 生 , 它 将 发 生 的 一 个 事件 . 
我 们 将 事件 4 和 B 的 交 记 作 ANB. 
ANB=A 和 8B 
American Journal of Public Health( 1995 年 7 月 ) 刊登 了 有 关 美 国 科罗拉多 州 居民 的 无 意识 
一 氧化 碳 (C0) 中 毒 的 一 项 研究 . 确定 了 最 近 6 年 时 间 里 的 1000 个 CO 中 毒 案例 的 发 生 原因 , 还 将 
每 个 案例 分 为 致命 的 或 非 致命 的 . 每 10 个 原因 /致命 状态 中 , 发 生 案例 的 比例 见 表 3. 2. 定义 如 下 
事件 : 











A; 1C0 中 毒 案例 是 由 火灾 引起 的 | 表 3.2 CO 暴露 原因 和 致命 状态 
IE Ei 人 £ — OÜ wF [. _ 

B: l CO 中 毒 案例 是 致 命 的 | i 暴露 原因 致命 的 非 致命 的 
a. 描述 这 个 试验 的 简单 事件 . 指派 这 些 简单 事件 与 火灾 有 关 0. 07 0.06 

的 概率 . 汽车 排放 气 0.07 0.19 
b. 描述 AUB. 锅炉 0.02 0.37 
c. HR AAB. 设备 /发 动机 0. 02 0. 175 
d. 计算 P(A4UB) 和 P(A4NMmB). 其 他 0. 005 0.020 
解 资料 来 源 : Cook, M. , Simon, P., 和 Hoffman, R.“ 美 国 


a. 这 个 试验 的 简单 事件 是 暴露 原因 和 致命 状 。 科罗拉多 州 的 无 意识 一 氧化 碳 中 毒 . "American Jounal 
态 的 不 同 组 合 . 例如 , 一 个 简单 事件 是 | 与 火灾 有 C Prblie Heath, 第 85 卷 ,第 7 期 , 1995 年 7 月 ( 表 1). 
关 / 致 命 的 | ; 另 一 个 是 | 与 火灾 有 关 / 非 致命 的 | ; 第 三 个 是 | 汽车 排放 气 /致命 的 | . 从 表 3.2 
你 可 以 看 出 , 一 共有 5 x2 =10 个 简单 事件 . 由 于 每 个 事件 的 概率 是 这 个 事件 在 一 个 长 观测 
序列 中 发 生 的 可 能 性 , 因此 每 个 简单 事件 的 概率 可 以 用 这 个 简单 事件 在 1000 个 案例 中 发 生 
的 比例 来 近似 . 这 些 比 例 列 在 表 3. 2 中 . 如 果 将 这 10 个 概率 相 加 ， 你 将 会 发 现 它们 的 和 等 
F1. 
b. 4 和 8 的 并 是 指 这 样 一 个 事件 , 即 我 们 观测 到 一 个 由 火灾 引起 的 CO 中 毒 案例 (事件 4) , 或 
者 观测 到 一 个 致命 案例 (事件 B) , 或 者 二 者 都 有 . 因此 , 事件 4UB 里 的 简单 事件 是 那些 4 RE. B 
RE, 或 者 4 和 B 同 时 发 生 的 事件 , 即 
AUB = | 火灾 /致命 的 ,火灾 / 非 致命 的 , 汽车 排放 /致命 的 ， 
锅炉 /致命 的 , 设备 /致命 的 , 其 他 /致命 的 | 
e. À 和 中 的 交 是 指 这 样 一 个 事件 ， 即 我 们 观测 到 一 个 CO 中 毒 案例 是 由 火灾 (事件 4) 引 起 的 并 
旦 观测 到 一 个 致命 案例 (事件 B). 在 图 3.4 中 , 你 可 以 看 出 具有 这 两 个 特征 的 简单 事件 
An B = | 火灾 /致命 的 | 
d. 回忆 一 个 事件 的 概率 等 于 组 成 这 个 事件 的 简单 事件 的 概率 之 和 , 我 们 有 
P(AUB) =P! 火 灾 / 致 命 的 | +P| 火灾/ 非 致命 的 | + P| 汽车 排放 /致命 的 | 
+ P| 锅炉 /致命 的 | + P| 设备 /致命 的 | +P| 其 他 /致命 的 | 
=0.07 +0. 06 +0. 07 +0.02 +0.02 +0. 005 =0. 245 


à 
w 
地 
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图 3. 4 的 维 恩 图 描述 了 这 个 并 . 

















A 火灾 / 非 致命 的 
° 
Po 汽车 排放 / 非 致命 的 
B 
锅炉 /致命 的 锅炉 / 非 致 命 的 
设备 /致命 的 设备 / 非 致命 的 
其 他 /致命 的 其 他 / 非 致 命 的 


图 3.4 例 3.5 中 4UB KERK 


以 及 
P(AnB) = 已 (火灾 /致命 的 ) =0. 07 
对 两 个 以 上 的 事件 也 可 以 定义 并 和 交 . 例如 , 事件 4UBUC 表示 三 个 事件 4、B 和 C 的 并 . 这 个 
事件 包括 4、B、C 中 的 简单 事件 集合 ， 如果 事件 4、B、C 的 任意 一 个 或 几 个 发 生 , 它 将 发 生 . 类 似 
地 , 交 ANBNC 是 指 所 有 三 个 事件 4、B、C 同时 发 生 的 事件 . 因此 , ANBNC 是 指 在 所 有 三 个 事件 
A. B. C 中 的 简单 事件 集合 . 
考虑 有 等 可 能 简单 事件 {1, 2, 3, 4, 5, 6] 的 掷 仍 子 试验 . 定义 事件 A, BL C 如 下 . 
A: | 掷 出 一 个 偶数 点 | 212, 4, 6] 
B: 掷 出 一 个 小 于 等 于 3 的 数 | = 11, 2, 3] 
C; | 掷 出 一 个 大 于 工 的 数 | = 12, 3, 4, 5, 6] 
a P(AUBUC) 
b. P(An Bn C) 
解 
a 事件 C 包括 掷 出 2, 3, 4, 5 或 6 的 简单 事件 ; 事件 8 包括 简单 事件 1, 2 或 3; 以 及 事件 4 外 
括 简单 事件 2, 4 或 6. 因此 , 4、B 或 C 发 生 的 事件 包括 $ 中 所 有 6 个 简单 事件 , 即 相应 于 撕 出 1, 2, 
3, 4, 5 或 6 的 简单 事件 . 因此 , P(A4UBUC) = P(S) =1. 
b. 你 可 以 看 出 , 只 有 当 你 观测 到 2 时 才 会 观测 到 所 有 的 事件 4、B 以 及 C. 因此 , SE An BC 
括 唯一 的 简单 事件 ,， 掷 出 一 个 2, 而 P(A4NBAC) = P(2) = 176. 
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3.4 补 事 件 


计算 事件 概率 时 , 一 个 非常 有 用 的 概念 是 补 事件 . 
定义 3.8 事件 4 的 补 9 是 指 4 不 发 生 事件 ， a AT 中 的 简单 事件 组 成 的 事件 . 我 


们 将 4 的 补 事件 记 作 A 注意 , AUA SS, FSA 
样本 空间 . ° 
事件 A 是 简单 事件 的 一 个 集合 , 包含 在 4e 中 的 ss . 
简单 事件 是 那些 不 在 4 中 的 简单 事件 , 如 图 3.5 所 

ZR. 注意 到 $ 中 的 所 有 简单 事件 不 是 在 4 th, 就 是 在 

A“ 中 , 并 且 没有 简单 事件 同时 在 4 和 4* 中 . 因此 得 出 图 3.5 补 事件 的 维 思 图 

结论 : 一 个 事件 和 它 的 补 事件 的 概率 之 和 必定 等 于 1. 





S 








补 关系 
补 事件 的 概率 之 和 等 于 1， 即 








P(A) +P(4) =1 





在 许多 概率 问题 中 ， 计算 感 兴趣 事件 的 补 事 件 的 概率 要 比 计算 事件 本 身 的 概率 更 容易 . 那么 由 于 
P(A) +P(A°) =1 
我 们 可 以 利用 下 面 的 关系 来 计算 P(A): 
P(A) -1- P(A*) 
CEEI sitos ime m. 利用 补 关系 计算 下 面 事 件 的 概率 : 
A: | 至少 观测 到 一 个 正面 | 
解 ” 我 们 知道 事件 4: | 至 少 观测 到 一 个 正面 } 由 下 面 的 简单 事件 组 成 : 
A: (HH, HT, TH| 
A 的 补 定义 为 当 4 不 发 生 时 发 生 的 事件 . 因此 ， 
A: | 没有 观测 到 正面 | = |TT) 
这 个 补 关 系 如 图 3. 6 所 示 . 假定 硬币 是 均匀 的 ， 
我 们 有 





P(A*) = PCTT) =+ 





因此 ， 





-1 ti-3 
P(A)=1-P(AS)=1- 53 图 3.6， 投 据 两 枚 硬币 中 的 补 事 件 


参考 例题 3. 3, 假定 从 装配 线 中 选择 10 个 产品 来 检查 . 仍然 假定 过 程 是 失控 的 , 有 缺陷 
CD) 和 无 缺陷 (NN) 产品 是 等 可 能 发 生 的 . 求 下 面 事件 的 概率 : 





Q 有 些 教材 用 符号 4' 表 示 一 个 事件 4 的 补 事件 . 
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A: { 至 少 观测 到 一 个 有 缺陷 的 产品 | 


解 我们 将 通过 下 面 5 个 步骤 来 计算 事件 的 概率 ( 见 3.2 38). 


步骤 1 
步骤 2 


步骤 3 


步骤 4 


定义 试验 . 试验 是 记录 10 个 产品 的 结果 (或 N). 
列 出 简单 事件 . 一 个 简单 事件 由 10 个 有 缺陷 和 无 缺陷 的 产品 的 特殊 序列 组 成. 这 样 ， — 
个 简单 事件 是 : 
DDNNNDNDNN 

TUR — PP BRA, 第 二 个 产品 有 缺陷 , 第 三 个 产品 没有 缺陷 ,等 等 . 其 他 如 
DNDDDNNNNN 和 NDDNDNDNND. 显然 ,简单 事件 的 数目 非常 多 一 多 得 无 法 列举 . 可 
以 证 明 ( 见 3.8 节 ) 这 个 试验 共有 21 = 1024 个 简单 事件 . 
指派 概率 . 由 于 在 失控 过 程 中 , 有 缺陷 产品 和 无 缺陷 产品 以 相同 的 比率 发 生 , 每 个 W 和 
D 序列 发 生 的 机 会 相同 ,因此 所 有 简单 事件 是 等 可 能 的 . 那么 

P( 每 个 简单 事件 ) = [二 


确定 事件 4 中 的 简单 事件 . 如 果 在 10 个 产品 的 序列 中 至 少 出 现 了 -个 D, 那么 这 个 简 


单 事件 就 属于 A. 但 是 , 如 果 我 们 考虑 4 的 补 事 件 , 我 们 发 现 
As; [10 个 产品 中 没有 观测 到 一 个 D| 


因此 , A* 只 包含 一 个 简单 事件 


As; 


因此 ， 


步骤 5 


{ NNNNNNNNNN } 


— 1024 


因为 我 们 知道 了 4 的 补 事件 的 概率 ,所 以 我 们 利用 补 事件 的 关系 ; 


P(A) x1- P(A*) =1-- 一 -= 一 < -0,999 


即 我 们 从 失控 过 程 生产 的 10 个 产品 的 序列 中 ， 观测 到 至 少 一 个 有 缺陷 , 实际 上 是 必然 的 . 


应 用 练习 

3.11 有 毒 的 化 学 事件 . 参看 练习 3. 1， Process Safety 
Progress ( 2004 年 9 月 ) 关于 台湾 有 毒化 学 事件 的 
研究 . 
a. 求 事件 发 生 在 化 工厂 或 非 化 工厂 的 概率 . 
b， 求 事件 不 是 发 生 在 学 校 实验 室 的 概率 . 

3.12 海滩 侵蚀 热点 地 区 . 参考 练习 3.2， 美国 陆军 





的 概率 . 将 你 的 答案 和 练习 3. 2f 进行 比较 . 

3.13 管理 系统 失效 . 参看 练习 3.4, Process Safety 
Progress( 2004 年 12 月 ) 关 于 83 个 管理 系统 失效 根 
源 的 研究 . 利用 补 法 则 求 一 次 失效 是 由 除了 程序 和 
实践 朴 忽 以 外 的 其 他 原因 造成 的 概率 . 将 你 的 答案 
和 练习 3. 4b 进行 比较 . f 


3.14 地 下 并 水 的 污染 . ZB 852] 3.5, Environmental 
Science & Technology (2005 4E 1 J ) 关于 美国 新 罕 布 
什 尔 州 223 口 井 中 甲 基 叔 丁 基 醚 (MTBE ) 污染 的 研 
究 . 每 口 井 根据 井 的 类 型 (公共 或 者 私有 ) 、 蓄 水 层 
(EARR) A MTBE 的 检测 水 平 ( 低 于 限制 或 检 
出 ) 进行 分 类 . 考虑 这 223 口 井 中 的 一 个 . 

a. 这 口 并 有 基 兰 蓄 水 层 和 MBTE 检测 到 的 概率 是 
多 少 ? 

b. 这 口 井 有 基 岩 蓄 水 层 或 者 检 出 MBTE 的 概率 是 
多 少 ? 

3.15 USDA 小 鸡 调 查 . 参看 练习 3. 6, USDA 关于 通 
过 排泄 物 污染 检查 的 被 宰杀 的 鸡 的 研究 . 考虑 一 个 
5 只 鸡 的 样本 , 它们 都 通过 了 标准 USDA 检查 . 每 
只 鸡 的 般 体 被 分 为 通过 排泄 物 污染 检查 或 者 没有 
通过 排泄 物 污染 检查 . 

a， 列 出 这 个 样本 的 简单 事件 . 


概 x 





O 


O 


b. 假定 a 中 的 简单 事件 是 等 可 能 的 , cR 5 只 鸡 中 
至 少 有 一 只 通过 排泄 物 污染 检查 的 概率 . 

e. 解释 为 什么 a 中 的 假定 对 于 这 个 样本 是 不 合理 
的 . (提示 : 参考 练习 3. 6 中 记录 的 结果 . ) 


.16 本 福 德 数字 定律 . 参看 练习 3. 8 American Sci- 


entist(1998 年 7-8 月 ) 关 于 随机 数 中 的 有 效 数字 的 
本 福 德 定律 的 研究 . 考虑 所 研究 的 743 个 数字 中 首 
位 有 效 数字 . 

a. 求 第 一 位 有 效 数字 大 于 5 的 概率 . 

. 求 第 一 位 有 效 数字 不 是 1 的 概率 . 

. 求 第 一 位 有 效 数字 是 偶数 的 概率 . 

. 求 第 一 位 有 效 数字 是 奇数 或 者 小 于 7 的 数 的 
概率 . 


a o0 c 


.17 暂停 不 用 的 油气 建筑 物 . 美国 联邦 法 规 要 求 营 


公司 在 停产 后 一 年 内 清除 所 有 暂停 不 用 的 海上 
wš 气 建筑 物 . 路 易 斯 安 那州 立 大 学 能 源 研 究 中 心 的 
研究 员 们 收集 了 墨西哥 湾 的 正在 使 用 的 和 暂停 不 
用 的 油气 建筑 物 数据 (Oi & Gas Journal, 2005 年 1 
月 3 日 ). 他 们 发 现 这 个 海湾 2003 年 底 有 2175 个 
正在 使 用 和 1227 个 无 用 (暂停 使 用 ) 建筑 物 . 下 面 
的 表 按 照 类 型 ( 沉 箱 、 油 并 保护 器 或 国定 的 栈桥 ) 
对 这 些 建 筑 物 进行 详细 分 类 . 考虑 这 些 油 气 建筑 物 
中 的 建筑 类 型 和 使 用 状态 . 


油井 固定 的 





沉 箱 保护 器 栈桥 总 计 
正在 使 用 503 225 1447 2175 
暂停 不 用 598 177 450 1 225 


资料 来 源 : Kaiser, M. , 和 Mesyanzhinov, D. “墨西哥 海湾 
暂停 使 用 建筑 物 的 制 表 研究 . " Oil & Gas Journal, 第 103 
卷 , 第 1 期, 2005 年 1 月 3 日 ( 表 2). 


列 出 这 个 试验 的 简单 事件 . 

.指派 简单 事件 的 合理 概率 . 

. 求 建筑 物 是 正在 使 用 的 概率 . 

. 求 建筑 物 是 油井 保护 器 的 概率 . 

求 建筑 物 是 暂停 使 用 的 沉 箱 的 概率 . 

求 建筑 物 是 暂停 使 用 的 或 者 固定 的 栈桥 的 
g 求 建筑 物 不 是 沉 箱 的 概率 . 

18 轮 盘 赌 的 结果 . 在 许多 美国 娱乐 场 流行 的 一 个 
游戏 是 轮 盘 赌 . 玩 轮 盘 赌 是 在 一 个 划分 为 38 个 等 
长 弧 的 圆 轮 上 旋转 一 个 球 , 这 些 弧 上 标 着 数字 00, 
0, 1, 2,…,35, 36. ERIS LE TE3IE BESTOSE B BS SE 
就 是 一 轮 游 戏 的 结果 . 数字 按 下 面 的 方式 涂 色 ， 


m e = ° = pb 


e 


1 3 5 7 9 12 14 16 18 
19 21 23 25 27 30 32 34 36 
2 4 6 8 10 11 13 15 17 
* 20 22 24 26 28 29 31 33 35 


绿 00 0 


游戏 者 可 能 以 很 多 不 同 的 方式 将 赌注 压 在 标签 上 ， 
包括 压 在 奇数 、 偶 数 、 红 、 黑 、 小 (1~18) 以 及 大 
(19 ~36) 结 果 上 . 考虑 下 面 的 事件 (00 和 0 看 作 非 
奇 非 偶 ) : 


红 


A: | 结果 是 奇数 | 

B: { 结 果 是 黑色 的 数 | 

C: | 结果 是 大 数 } 
计算 下 面 事件 的 概率 : 


a AUB b. ANC c BUC d B e ANBNMC 


.19 自 喷 并 的 概率 . 钻探 石油 的 冒险 包括 在 某 地 区 


的 不 同 地方 销 探 6 口 油井 . 假定 每 次 钻探 将 生产 一 
口 干 井 或 一 口 自 喷 并 . 假设 这 个 试验 的 简单 事件 是 
等 可 能 的 , 求 至 少 发 现 一 口 自 喷 井 的 概率 . 


.20 ”钢板 在 汽车 上 的 用 法 . 增强 钢板 的 防腐 蚀 性 是 


汽车 制造 商 最 优先 考虑 的 问题 . 在 马自达 汽车 公司 
(HÆ), 他 们 非常 偏好 于 利用 薄 的 合金 涂 层 改 进 
防 锈 和 粘 合 能 力 . 下 表 给 出 了 用 于 出 口 到 美国 的 马 
自 达 626 型 钢板 的 详细 分 类 . 假定 每 张 钢板 是 从 生 
产 马自达 626 所 用 的 钢板 中 随机 选择 的 , 我 们 对 所 
选 钢板 的 类 型 感 兴 趣 . 

a. 定义 这 个 试验 . 

b. 列 出 这 个 试验 的 简单 事件 . 

c， 基 于 所 用 的 马自达 钢板 , 指派 简单 事件 的 概率 . 
d. 钢板 是 热 轧 、 高 强度 类 型 的 概率 是 多 少 ? 

e. 钢板 是 冷 轧 类 型 的 概率 是 多 少 ? 
f 





. 钢板 没有 涂 层 的 概率 是 多 少 ? 
钢板 类 型 使 用 的 百分率 

冷 轧 、 标 准 强度 、 没 有 涂 层 27 
冷 轧 、 高 强度 、 没 有 涂 层 12 
冷 轧 、 标 准 强度 、 有 涂 层 30 
冷 轧 、 高 强度 、 有 涂 层 15 
热力 、 标 准 强度 、 没 有 涂 层 8 
HIL, BBE, RARE 5 
热 轧 、 标 准 强度 、 有 涂 层 3 
热 轧 、 高 强度 、 有 涂 层 0 

总 计 100 
资料 来 源 : Chandler, H. E. “ 马 白 达 汽 车 公司 的 材料 趋 


势 . ”Metal Progress , 第 129 卷 , 第 6 期 ， 1986 年 5 月 ,第 
57 页 (图 3). 
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3.5 条 件 概率 


目前 为 止 我 们 所 讨论 的 事件 概率 , 给 出 了 当 试 验 重复 进行 很 多 次 时 , 事件 发 生 的 相对 频率 . 除 
了 定义 试验 , 没有 假定 特殊 的 条 件 , 因此 称 它们 为 无 条 件 概率 . 

当 我 们 知道 可 能 影响 结果 的 附加 知识 时 ， 有 时 可 能 希望 改变 对 事件 概率 的 估计 . 这 种 经 修正 的 
概率 称 作 事 件 的 条 件 概率 . 例如 , 我 们 已 经 证 明了 在 投掷 一 颗 均匀 仍 子 时 , 观测 到 偶数 (事件 4) 的 概 
率 是 1/2. 但 是 , 假设 你 已 经 知道 了 这 样 一 个 信息 ， AW T 8955 BAGRONTART Bj 一 个 数 ( 事 
VF B). 你 仍然 认为 那 次 投掷 货 子 观测 到 偶数 的 概率 / =< Š 
等 于 1/2? 如 果 你 推 想 在 8 已 经 发 生 的 假定 下 , BERE | 








本 空间 从 6 个 简单 事件 减少 到 3 个 简单 事件 ( 即 那些 » iie 
包含 在 事件 B 中 的 简单 事件 ), 缩减 后 的 样本 空间 如 ”\、 ANB A 
图 3.7 所 示 . I 
由 于 在 事件 B 的 缩减 样本 空间 的 三 个 数字 中 只 图 3.7 已 知事 件 B8 发 生 的 情况 下 ， 
有 一 个 偶数 是 2, 并 且 山 子 是 均匀 的 , 我 们 得 出 结论 ， 投掷 假 子 试验 的 缩减 样本 空间 


在 给 定 妇 发生 的 条 件 下 , 4 发 生 的 概率 是 1 比 3, 或 1/3. 我 们 将 用 记号 P(A418) 表 示 给 定 事件 B RE 
BF, 事件 4 发生 的 概率 . 对 掷 仍 子 的 例子 ,我 们 记 作 


P(AIB) = 一 


为 了 得 到 给 定 事 件 B REN, 事件 4 的 概率 , 我 们 如 下 进行 : 我 们 用 4 落 入 事件 B 的 缩减 样本 
空间 的 概率 ( 即 PCA Y B) ) 除 以 缩减 样本 空间 的 概率 ( 即 P(B)). PROS TRECE S I, 其 中 事件 
A: 上 观测 到 一 个 偶数 | 以 及 事件 B. 1 观测 到 一 个 小 于 等 于 3 的 数 } ,我 们 得 到 
P(AnB) _ P(2) 

P(B) P(1) +P(2) « P(3) 
一 般 情况 下 , 这 个 P(418) 公 式 是 成 立 的 . 





P(AIB) = = (1/6)/ (3/6) x 





条 件 概率 公式 | 
为 了 求 已 知事 件 电 发生 时 ,事件 4 发 生 的 条 件 概率 , 用 4 和 B 同 时 发 生 的 概率 除 以 电 发 生 的 概率 ， 即 
P(AIB) = m 


其 中 我 们 假定 P(B) z0. 











| 例 3.9| 考虑 过 程控 制 中 的 如 下 问题 : 假定 你 感 兴趣 的 是 运送 到 买方 的 产品 ( 例如, 小 机 械 零 件 ) 
确认 与 买方 要 求 一 致 的 概率 . 在 允许 运送 之 前 , 包含 大 量 零件 的 批 必 须 通 过 检查 .[ 假定 并 不 是 检查 
一 批 中 的 所 有 零件 . 例如 , 如 果 从 这 一 批 中 选取 的 零件 样本 的 平均 产品 特征 (如 直径 ) 落 在 某 个 范围 
以 和 内， 即使 可 能 有 一 个 或 几 个 零件 落 在 规格 以 外 , 接受 整 批 产品 . ] 令 1 表示 事件 :一 批 产品 通过 检 

查 ; Q BRRR: 一 批 产 品 中 的 单个 零件 符合 买方 要 求 . 那么 , rmB 表示 简单 事件 : 单个 零件 运送 
给 买方 ( 当 一 批 产品 通过 检查 时 , 这 将 发 生 ) 并 且 符 合 要求 ; IOB 表示 简单 事件 : 单个 零件 运送 给 买 
R, 但 不 符合 要 求 ; 等 等 . 假定 下 表 列 出 的 是 4 个 简单 事件 的 概率 . 求 已 经 运送 到 买方 的 -个 零件 符 
合 买方 要 求 的 概率 . 





简单 事件 概率 
INB 0. 80 
IAB: 0. 02 
FAB 0.15 
I nB: 0.03 


E ”如 果 从 一 批 产品 中 选择 一 个 零件 , 买方 接受 这 个 零件 的 概率 是 多 少 ? 为 了 被 接受 , 这 个 零 
件 必须 首先 运送 到 买方 ( 即 包 含 这 个 零件 的 一 批 产 品 必须 通过 检查 ) 而 且 零 件 必 须 满足 买方 的 要 求 ， 
因此 这 个 无 条 件 概率 是 POIO B) =0. 80. 

相反 , 假定 你 知道 选择 的 零件 来 自 通过 检查 的 批 . 现在 你 感 兴趣 的 是 已 知 这 个 零件 运送 到 买方 
时 , 它 符合 要 求 的 概率 , 即 你 希望 确定 条 件 概率 PBID. 根据 条 件 概率 的 定义 ， 


P(BII) Om. 
其 中 事件 
1: | 零件 运送 到 买方 | 
包含 两 个 简单 事件 : 
INB: {零件 运送 到 买方 是 符合 要 求 | 
以 及 


INB*: | 零件 运送 到 买方 但 不 符合 要 求 } 
”前 面 介 绍 过 一 个 事件 的 概率 等 于 它 的 简单 事件 概率 之 和 , 我 们 得 到 
P(I) =P(InB) +P(IñnB:) =0. 80 +0.02 =0. 82 
那么 在 已 知 零件 运送 到 买方 , 这 个 零件 符合 要 求 的 条 件 概 率 是 : 


_P(InB) 0.80 _ 
P(BID STR =) gz 70 976 


正如 我 们 所 期 望 的 , 已 知 零件 运送 到 买方 , 它 符合 要 求 的 概率 高 于 一 个 零件 被 买方 接受 的 无 条 
件 概率 . 
由 联邦 贸易 委员 会 (FTC) 进行 的 关于 消费 者 对 产品 投诉 的 调查 , 引起 厂商 对 产品 质量 
的 注意 . 一 个 食品 处 理 机 制造 商 分 析 了 很 多 消费 者 的 投诉 , 发 现 他 们 属于 表 3. 3 列 出 的 6 种 类 型 . 





如 果 收 到 了 一 个 消费 者 的 投诉 , 已 知 投诉 发 生 在 保 表 3.3 产品 投诉 的 分 布 
质 期 内 , 投诉 的 原因 是 产品 外 观 的 概率 是 多 少 ? gu 投诉 原因 外观 uu 
解 令 4 表 示 一 个 投诉 原因 是 产品 外 观 事件 , 令 - EB — 


8 表示 投诉 发 生 在 保质 期 内 事件 . 检查 表 3.3， 你 可 以 PRAA 18% 13% 3:2 — 63% 


看 到 (18 +13 + 12)% =63% 的 投诉 发 生 在 保质 期 内 . pq PA 12% 2% 3% 37% 
Jt, P(B) =0. 63. 由 外 观 导致 并 且 发 生 在 保质 期 内 的 投 合计 30% 35% 35% 100% _ 


诉 (事件 4mB) 的 百分数 是 32%. 因此 , P(AmB) = 
0. 32. 

利用 这 些 概率 值 , 我 们 可 以 计算 条 件 概率 PCALB) , 即 已 知 投诉 发 生 在 保质 期 内 , 投诉 的 原因 是 
外 观 的 概率 : 


62 





3. 


e 


d 


P(41B) -FXADB) -0.32 -0 .51 


因此 ,你 可 以 看 出 一 半 稍 多 的 发 生 在 保质 期 内 的 投诉 是 由 于 控 伤 、 思 痕 或 食品 处 理 机 表面 的 其 
他 缺陷 引起 的 . 


(9) 应 用 练习 


21 侦查 TNT 的 踪迹 . 佛罗里达 大 学 材料 科学 
和 工程 学 系 的 研究 员 发 明了 一 种 迅速 侦查 TNT 
踪迹 的 技术 .( Today, 2005 年 春 . ) 这 个 方法 包 
括 用 一 个 光 致 分 光 镜 ( 即 一 个 激光 灯 ) 照射 可 
能 被 污染 体 , 提供 即 时 结果 ， 且 不 会 给 出 假 阳 
性 . 在 这 项 应 用 中 , 如 果 物 体 实际 上 没有 TNT, 
而 激光 灯 探 测 到 了 TNT 的 踪迹 , 那么 发 生 假 阳 
TE. S 4 表示 激光 灯 探 测 到 TNT 事件 . SBR 
示 物 体 不 包含 TNT 踪迹 事件 . 假 阳 性 的 概率 是 
0. AEU, OAIE A AM B KJET 
这 个 概率 . - 


.22 地 下 井 水 的 污染 . 参看 练习 3.5, Environmen- 


tal Science & Technology( 2005 年 1 月 ) 关 于 美国 新 
罕 布什 尔 州 223 口 井 甲 基 叔 丁 基 醚 (MTBE) 污 染 
的 研究 . 每 口 井 根据 井 的 类 型 (公有 或 私有 )、 鞠 
水 层 ( 基 崖 或 者 松散 ) 以 及 MTBE 的 检测 水 平 ( 低 
于 限制 或 检测 到 ) 进行 分 类 . 考虑 这 223 口 井 中 的 
—H. 
a. 如 果 这 口 井 的 类 型 是 公有 型 , 那么 这 口 间 有 其 
岩 蓄 水 层 的 概率 是 多 少 ? 
b. 已 知 这 口 井 有 基 涯 蓄 水 层 , 它 有 检测 到 MTBE 
水 平 的 概率 是 多 少 ? 
23 暂停 不 用 的 油气 建筑 物 . 参看 练习 3.17, Oil 
& Gas Journal(2005 41H 3 H ) 关于 墨西哥 湾 正 
在 使 用 的 和 暂停 不 用 油气 建筑 物 的 研究 . FREY 
汇总 了 研究 的 结果 . 考虑 这 些 油 / 气 建 筑 物 的 结构 
类 型 和 使 用 状态 . 








N 油井 固定 的 、 

沉 箱 保护 器 栈桥 总 计 
正在 使 用 503 225 1447 2175 
暂停 不 用 598 177 450 1 225 





资料 来 源 : Kaiser, M. ， 和 Mesyanzhinov, D. “BHRAS 

暂停 使 用 建筑 物 的 制 表 研 究 . ”Oil & Gas Journal, 第 103 

15. 98 1 HH, 2005 年 1 月 3 日 ( 表 2). 

a. 已 知 建造 物 是 固定 的 栈桥 , 该 建筑 物 正在 使 用 
的 概率 是 多 少 ? 


b. 已 知 建筑 物 是 暂停 不 用 的 ,该 建筑 物 是 油井 保 
护 器 的 概率 是 多 少 ? 


3.24 新 西 兰 绝种 的 岛 类 . 参看 练习 2.9, Evolution- 


ary Ecology Research ( 2003 年 7 月 ) 关 于 新 西 兰 绝种 

鸟 类 总 体 类 型 的 研究 . 考虑 保存 在 NZBIRDS 文件 

中 的 132 种 鸟 类 的 灭绝 状态 (绝种 、 从 岛 迁 移 、 现 

存 ) 的 数据 . 这 里 重新 给 出 汇总 在 MINITAB 输出 中 

的 数据 . 假定 你 从 132 种 鸟 类 中 选择 10 种 (无 放 

回 ) 并 记录 每 种 的 绝种 状态 . 

a. 你 选择 的 第 一 个 种 类 是 绝种 的 概率 是 多 少 ? 
(提示 : 在 MINITAB 输出 中 , 绝种 = Yes. ) 

b. 假定 你 选择 的 前 9 个 种 类 都 是 绝种 的 ,你 选择 
的 第 10 个 种 类 是 绝种 的 概率 是 多 少 ? 


Tally for Discrete Variables: Extinct 





Extinct Count Percent 
Absent 16 12.12 
No 78 59.09 
Yes 38 28.79 

N= 132 





练习 3. 24 的 MINITAB 输出 


.25 无 人 监视 系统 . 刊登 在 IEEE Computer Applica- 


tions in Power 上 的 一 篇 文章 描述 了 “一 个 无 人 监视 
系统 , 利用 摄 相机 和 微 处 理 器 , 对 户 内 和 户外 的 交 
入 者 进行 实时 检测 ,并 且 不 会 有 不 合 逻 辑 的 检 
测 . "在 日 本 东京 的 户外 不 同 气 候 条 件 下 ,对 这 个 
系统 进行 了 测试 . 每 个 条 件 下 检测 到 的 阅 入 者 人 数 
以 及 漏 检 的 人 数列 在 下 表 中 . 


r 
气候 条 件 


晴天 HR 雨天 FẸ HA 
检测 到 的 间 入 者 21 28 26 7 185 
ét BJ X RE 0 6 6 3 10 
总 数 21 234 232 10 195 
IEEE Computer Applications in Power, 1990 年 4 月 , 第 24 页 . 
a. 在 阴 天 条 件 下 ,无 人 监控 系统 检测 到 闻 和 者 的 
概率 是 多 少 ? 
b. 已 知 无 人 监控 系统 漏 检 了 一 个 间 人 者 ,气候 条 
件 是 下 雪 天 的 概率 是 多 少 ? 
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3.26 HARER. 参看 轮 盘 赌 游戏 以 及 练习 3. 18 
描述 的 事件 . 求 
a. P(AIB) b. P(BIC) c. P(CIA) 


3.27 数据 交换 系统 . 一 个 数据 交换 系统 具有 高 选择 
性 的 概率 是 0.72, 具有 高 保 真 度 的 概率 是 0.59, 
二 者 都 有 的 概率 是 0. 33. 求 一 个 具有 高 保 真 度 的 系 
统 也 将 具有 高 选择 性 的 概率 . 

3.28 核 安全 风险 . 美国 核 管理 委员 会 评估 了 核电 站 
的 安全 风险 . 委员 会 估计 一 个 核反应 堆 的 堆 芯 燃料 
熔化 的 概率 是 100 000 分 之 1. 核反应 堆 堆 芯 燃 料 
熔化 并 且 每 年 发 生 少 于 1 个 潜在 致命 性 癌症 的 概 
率 估计 为 0. 00000005. 利用 这 个 信息 估计 已 知 核 反 
应 堆 堆 蕊 燃料 熔化 ,每 年 至 少 发 生 一 个 潜在 致命 

3.29 和 鱼 的 污染 . 参看 美国 陆军 工程 兵团 关于 亚 拉巴 
马 州 田纳西 河 鱼 的 DDT 污染 研究 ( 见 第 1 章 活动 
中 的 统计 学 ). 调查 的 一 部 分 集中 在 污染 的 鱼 向 上 


b， 已 知 一 条 鱼 是 在 上 游 275 ~ 300 mile 处 捕获 的 ， 
那么 它 是 小 口 胭脂 鱼 的 概率 是 多 少 ? 


3.30 RAIH. 生态 学 家 将 森林 断 片 的 原因 分 成 人 


为 的 ( 即 由 于 人 类 开发 活动 , 如 公路 建设 或 伐木 搬 
运 ) 或 源 于 自然 的 (例如 由 于 沼泽 地 或 火灾 ). Con- 
servation Ecology(2003 年 12 月 ) 刊 登 了 一 篇 关于 54 
个 南美 森林 断 片 原因 的 文章 . 研究 人 员 利 用 先进 的 
高 集成 卫星 映像 对 每 个 森林 确定 断 片 指 标 . 在 森林 
的 航 摄像 片上 分 成 9 x9 格 , 格子 的 每 个 正方 形 ( 像 
素 ) 分 为 森林 (F)、 人 为 的 土地 利用 (A) 或 者 自然 土 
地 遮盖 (N). 这 里 给 出 了 格子 的 一 个 例子 . 格子 的 边 
(这 里 “ 边 " 是 将 任意 两 个 相 邻 像素 分 隔 开 的 假想 的 
直线 ) 分 为 A-A, N-A, F-A, F-N, N-N 或 者 F-F xl. 








游 迁 移 多 远 . (如 果 一 条 鱼 的 DDT 浓度 超过 每 百 万 
分 之 5.0, 则 认为 是 受 污 染 的 . ) 回忆 DDT 文件 给 
出 了 一 个 包含 144 种 鱼 的 样品 中 每 条 鱼 的 DDT 浓 
度 、 种 类 以 及 捕获 的 位 置 ( 离 河流 入 口 处 的 英里 ). 
下 表 给 出 了 每 个 种 类 - 位置 组 合 发 现 的 受 污 染 鱼 
数目 . 假定 一 条 污染 的 鱼 是 从 河流 中 捕获 的 . 











捕获 位 置 
275 ~300 305 -325 330 ~350 
种 类 ”小口 胭脂 鱼 9 7 0 
pi ud 0 0 1 
海峡 鲍鱼 31 23 6 





a. 已 知 一 条 鱼 是 海峡 钱 鱼 , 它 在 上 游 330 ~350 mile 
处 捕获 的 概率 是 多 少 ? 











a 参看 上 面 所 示 的 格子 . 注意 在 格子 内 部 有 12 条 
W. 将 每 条 边 分 为 A-A, N-A, F-A, F-N, N-N 发 
者 F-F. 

b. 研究 人 员 仪 考虑 格子 中 的 下 边 来 计算 断 片 指 标 . 
数 出 了 边 的 个 数 . (这 些 边 代表 试验 的 样本 空 
fg. ) 

c. 已 知 选 定 了 一 条 下 边 , 求 它 是 一 条 F-A 边 的 概 
率 .( 这 个 概率 与 研究 人 员 计 算 的 人 为 断 片 指标 
成 比例 . ) 

d. 已 知 选 定 了 一 条 下 边 , 求 它 是 一 条 F-N 边 的 概 
率 . (这 个 概率 与 研究 人 员 计算 的 自然 断 片 指标 
成 比例 . ) 


3.6 并 和 交 的 概率 法 则 


由 于 事件 的 并 和 交 本 身 是 事件 , 因此 我 们 总 可 以 通过 将 合成 它们 的 简单 事件 的 概率 相 加 来 计算 
它们 的 概率 . 但 当 某 些 事件 的 概率 已 知 时 , 利用 两 条 法 则 中 的 一 个 或 者 两 个 来 计算 并 与 交 的 概率 是 
比较 容易 的 . 我 们 举例 说 明 怎样 和 为 什么 用 这 些 法 则 . 

EES S525 3585) iom. 晶 观 测 到 正面 . 定义 下 面 两 个 事件 ， 
A: | 观测 到 一 个 偶数 | 
B: | 观测 到 一 个 小 于 3 的 数 } 
假定 P(A) 20.4, P(B) 0.2, P(ANMB) =0.1. x P(AU B). 
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(提示 : 我 们 知道 某 些 情况 下 这 些 概率 的 假定 是 非常 不 现实 的 , 但 是 这 个 例子 将 阐述 一 个 观 











点 . ) 
解 研究 图 3. 8 中 的 维 恩 图 , 我 们 可 以 得 到 能 帮助 我 们 求 出 PCAU 8) 的 信息 . 可 以 看 出 
P(AU B) =P(1) +P(2) +P(4) +P(6) KE — a T 
我 们 还 知道 B - ia 
P(A) 2 P(2) + P(4) + P(6) 20.4 
P(B) =P(1) +P(2) 20.2 w n 1 “9 Sn 





P(AnB) =P(2) =0.1 | j 
.8 n 
如 果 把 构成 事件 A 和 B 的 简单 事件 的 概率 相 加 ， oce 
我 们 得 到 di | \ 
P(A) P(B) | x 
P(A) +P(B) -P(2) + P(4) + P(6) * P(1) + P(2) 
P(AUB) PUANB) \ 全 部 的 阴影 区 域 是 AUB 


=P(1) « P(2) « P(4) « P(6) + P(2) 











因此 由 减法 , 我 们 有 图 3.9 并 的 维 因 图 
P(AUB) =P(A) +P(B) - P(AnB) 20.440.2-0.120.5 
研究 图 3.9 的 维 恩 图 , 你 可 以 看 出 例 3. 11 所 用 的 方法 可 以 推广 到 求 任意 试验 中 两 个 事件 
的 并 . 两 个 事件 4 和 B 的 并 的 概率 , 总 可 以 通过 将 P(4) 和 P(B) 相 加 再 减 去 P(A n B) 而 求 得 . 
注意 由 于 (4nB) 中 的 简单 事件 概率 重复 计算 了 两 次 ， 一 次 在 PCA) m, 一 次 在 P(B) rp. 因此 
我 们 必须 减 去 P(A4m8B). 计算 两 个 事件 并 的 概率 公式 ， 通常 称 为 概率 的 加 法 法 则 , 见 下 面 的 
框 格 . 








概率 的 加 法 法 则 
事件 4 与 并 的 概率 等 于 事件 4 与 B 的 概率 之 和 减 去 事件 4 与 B 交 的 概率 : 
P(AU B) - P(A) +P(B) - P(AnB) 








PEZA 一 个 工厂 的 记录 表明 所 有 受伤 员工 中 有 12% 去 医院 治疗 , 16% 第 二 天 来 上 班 ,2% 夫 医 
院 治疗 并 且 第 二 天 回来 上 班 . 如 果 一 名 员工 受伤 了 , 他 被 送 到 医院 治疗 ,或 者 第 二 天 回来 上 班 ,或 者 
二 者 , 即 送 到 医院 治疗 且 第 二 天 回来 上 班 的 概率 分 别 是 多 少 ? 
解 考虑 下 面 的 事件 : 

A: | 一 名 受伤 的 员工 送 到 医院 治疗 | 

B; | 一 名 受伤 的 员工 第 二 天 回来 上 班 | 
那么 , 根据 例题 给 出 的 信息 , 我 们 知道 

P(A) z0.12 P(B) =0.16 
及 事件 { 受伤 的 员工 接受 医院 治疗 并 于 第 二 天 回来 上 班 | 的 概率 为 ， 
P(AnB) =0.02 
一 名 受伤 员工 送 去 医院 , 或 者 于 第 二 天 回来 上 班 ,或 者 二 者 的 事件 是 并 4UB. AUB 的 概率 通过 概率 
的 加 法 法 则 得 到 : 
P(AUB) =P(4) * P(B) -P(ANMB) =0.12 +0.16 -0. 02 =0. 26 
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因此 , 在 所 有 受伤 的 员工 中 , 有 26% 或 者 送 去 医院 , 或 者 第 二 天 回来 上 班 , 或 者 二 者 . 
X ANB 不 包含 简单 事件 时 , 事件 4 和 8B 之 间 存 在 一 个 非常 特殊 的 关系 . 这 种 情况 下 , 我 们 称 事 
件 4 和 B 是 互 斥 事 件 . 


定义 3.9 如 果 AMB 不 包含 简单 事件 , 事件 4 4 
和 B 是 互 斥 的 . 


图 3. 10 给 出 了 两 个 互 斥 事 件 的 维 恩 图 . 事件 4 和 
B 没有 共有 的 简单 事件 , 即 4 和 8 不 能 同时 发 生 , H m 
P(AMB) -0. 因此 , 我 们 有 下 面 的 重要 关系 . 图 3. 10 互 斥 事件 的 维 恩 图 








S 








互 斥 事件 的 加 法 法 则 
如 果 两 个 事件 4 与 是 互 斥 的 , 那么 4 与 B 并 的 概率 等 于 4 与 B 的 概率 之 和 : 
P(AUB) =P(A) + P(B) 











CEE 考虑 投掷 两 枚 均匀 硬币 的 试验 , 求 观测 到 至 少 一 个 正面 的 概率 . 

解 ” 定 义 事件 

A: | 至 少 观测 到 一 个 正面 | 

B; | 观测 到 一 个 正面 | 

C: [观测 到 两 个 正面 | 

注意 , 4=BUC BR Bn C 不 包含 简单 事件 ( 见 图 
3.11). 因此 , B 和 C 是 互 斥 的 ,所 以 

1 1 3 


P(A) -P(BUC) - P(B) «P(C) == t+ 


虽然 例 3. 13 非常 简单 ,但 是 用 包括 习惯 用 语 “ 至 少 * 或 “最 多 ”的 字句 描述 互 斥 事件 的 并 ,对 表 
示 事 件 的 概念 是 非常 有 用 的 . 这 使 我 们 能 够 由 互 斥 事件 的 概率 求 事件 的 概率 . 
例 3. 14 说 明 概 率 的 第 二 条 法 则 将 帮助 我 们 求 两 个 事件 交 的 概率 . 
DEEH 州 运输 部 的 工程 师 负责 监督 建筑 公司 竞争 建设 新 道路 递交 的 秘密 投标 . 感 兴趣 的 事件 是 
一 家 名 叫 FMPaving 的 建筑 公司 将 操纵 投标 过 程 , 以 在 一 个 没有 竞争 性 的 价格 上 增加 赢得 建设 道路 权 
利 的 机 会 . 这 个 事件 是 下 面 两 个 事件 的 交 ; 
A; | FMPaving 参加 投标 | 
B; | FMPaving 操纵 投标 | . 
基于 从 州 计 算 机 投标 监视 系统 获得 的 信息 , 这 位 工程 师 估 计 FMPaving 参加 投标 的 概率 是 0.90, HE 
知 FMPaving 参加 投标 ,投标 被 操纵 的 概率 是 0. 25, BI 
P(A) 20.90 H P( BIA) =0. 25 
根据 提供 的 信息 ，FMPaving 为 了 建设 新 道路 提交 一 个 非法 投标 的 概率 是 多 少 ? 即 求 
P(An B). 
— R 正如 你 所 看 到 的 , 我 们 已 经 有 了 求 两 个 事件 交 的 概率 公式 . 回顾 给 定 4 时 B 的 条 件 概 
率 是 ; 





图 3.11 投掷 硬币 试验 的 维 恩 图 


P(BIA) PODES) 


^X x 
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等 式 两 边 同 时 乘 以 PCA) , 我 们 得 到 了 事件 4 和 8B 交 的 概率 公式 . 通常 称 其 为 概率 的 乘法 法 则 ， 表 
RÀ: 
P(AnB) 2 P(A)P(BIA) 
因此 ， 
P(4mB) = (0.90) (0. 25) =0. 225 
FMPaving 将 提交 一 个 非法 投标 的 概率 是 0. 225. 





概率 的 乘法 法 则 
P(AnB) =P(AIB)P(B) = P(BI4)P(4) 











CEA 考虑 投掷 一 枚 均匀 硬币 两 次 的 试验 , 记录 下 每 次 投掷 的 结果 . 定义 如 下 事件 ， 
A; | 第 一 次 投 挪 是 正面 } 
B: | 第 二 次 投 掀 是 正面 | 
如 果 知 道 事件 4 已 经 发 生 , 是 否 会 影响 事件 B 发 生 的 概率 ? 
解 直觉 上 ,答案 应 该 是 不 ,因为 第 一 次 投掷 的 结果 无 法 影响 第 二 次 投掷 的 结果 . 我 们 来 证 实 
我 们 的 直觉 . 回顾 这 个 试验 的 样本 空间 ， 
1. 观测 到 HH. 
2. 观测 到 HT. 
3. 观测 到 7H. 
4. 观测 到 TT. 
每 个 简单 事件 的 概率 是 1⁄4. 因此 ， 
P(B) =P(HH) +P(TH) 和 P(A) =P(HH) + P( HT) 


现在 , P(B14) 是 多 少 ? 





P(BIA) -P(AQB) _P(HH) _ 


l 
4 1 
P(A) _P(A) ^1 


~ 1 2 
2 
现在 我 们 可 以 看 到 P(B) 21/2 以 及 P(B14) =1⁄2. 知道 了 第 一 次 投掷 的 结果 是 正面 并 不 影响 第 
二 次 投掷 是 正面 的 概率 . 不 管 我 们 是 否 知道 第 一 次 投 撕 的 结果 ,这 个 概率 都 是 1/2. 当 这 种 情况 发 生 
时 , 我 们 说 两 个 事件 4 和 8B 是 独立 的 . 
定义 3. 10 如 果 忆 的 发 生 不 政变 4 发生 的 概率 ,那么 事件 4 和 B 是 独立 的 ， 即 如 果 
P(AIB) = P(A) 
N) F4 A do B X d 3 db. 
当 事 件 4 和 B 是 独立 的 , 下 面 的 式 子 也 成 立 ， 
P(BIA) =P(B) 
不 独立 的 事件 称 作 是 相关 的 . 


CEA IESUS BUS SIHRT- EUER, 并 定义 如 下 事件 ， 
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A: | 观测 到 一 个 偶数 | 
B: | 观测 到 一 个 小 于 等 于 4 的 数 } 
事件 4 和 事件 B 独立 吗 ? 
解 ” 试验 的 维 恩 图 见 图 3. 12. 我 们 首先 计算 : 


P(A) =P(2) + P(4) +P(6) =} 


P(B) =P(1) +P(2) +P(3) +P(4) =4 -2 


P(AnB) =P(2) + P(4) = 二 = 二 


现在 假定 8 已 经 发 生 , 给 定 B 时 4 的 条 件 概 
率 是 : 








1 

7273 = P(A) 
3 S 

因此 , B 的 发 生 不 改变 观测 到 一 个 偶数 的 概 图 3.12 例 3.16 的 维 恩 图 

率 一 一 它 仍 为 1/2. 因此 , 事件 4 F B 是 独立 的 . 


注意 , 如 果 计 算 已 知 4 时 B 的 条 件 概 率 , 结论 是 相同 的 ， 








1 
P(AIB) 52052 -$- 





P(BIA) =PC4nB) _ 


3 — 
P(A) l. 
2 





2 
EPa) 


| 例 3.17 | 参看 例 3. 10 关于 消费 者 产品 投诉 的 研究 . 在 保质 期 内 和 期 外 不 同类 型 投诉 的 百分比 见 表 
3.3. 定义 如 下 事件 : 

A: {投诉 的 原因 是 产品 外 观 | 

B: | 投诉 发 生 在 保质 期 内 | 
A 和 中 是 独立 的 事件 吗 ? 

解 MR P(AIB) =P(A) , 那么 事件 4 和 B 是 独立 的 . 在 例 3. 10 中 我 们 计算 得 到 P(A1B) 为 
0.51, 由 表 3.2, 我 们 可 以 看 到 

P(4) =0.32 +0.03 =0. 35 

因此 , PC B) ASSET P(A), 4 和 B 不 是 独立 事件 . 

关于 独立 性 我 们 将 给 出 最 后 的 三 点 . 首先 ,与 互 斥 性 不 一 样 , 独立 性 不 能 由 维 恩 图 证 明 或 说 明 . 
一 般 , 检查 独立 性 的 最 好 方法 是 计算 定义 中 的 概率 . 

其 次 是 互 斥 性 和 独立 性 之 间 的 关系 . 假定 事件 4 和 8B 是 互 尺 的 , 如 图 3. 10 所 示 , 这 些 事件 是 独 
立 的 还 是 相关 的 ? 即 8 发 生 的 假定 是 否 改变 4 发 生 的 概率 ?如 果 我 们 假定 B 已 经 发 生 , 4 就 不 可 能 
同时 发 生 , 所 以 答案 是 肯定 的 . 因此 , 互 斥 事件 是 相关 事件 O. 





O 除非 其 中 有 一 个 事件 的 概率 为 0, 结果 总 是 成 立 的 . 


B 
w 
k. 
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最 后 , 独立 事件 交 的 概率 是 非常 容易 计算 的 . 考虑 计算 交 的 概率 公式 , RITE: 
P(AnB) =P(B)P(AIB) 
因此 ， 3$ ARI B 独立 时, 由 于 P(418) = PCA) , 因此 我 们 有 下 面 方 框 中 有 用 的 法 则 . 





独立 事件 的 乘法 法 则 
如 果 事件 4 和 B 是 独立 的 , 那么 4 和 8B 的 交 的 概率 等 于 4 和 和 B 的 概率 乘积 ,， H 
P(ANB) =P(A)P(B) 











在 投掷 仍 子 试验 中 ,如 果 般 子 是 均匀 的 , 我 们 在 例 3. 16 中 证 明了 事件 4; {观测 到 一 个 偶数 | 和 
B: | 观测 到 一 个 小 于 等 于 4 的 数 } 是 独立 的 . 因此 ， 


P(AnB) = P(A)P(B) = BE - 
这 与 我 们 在 那个 例子 中 得 到 的 结论 是 一 致 的 : 
1 


P(AnB) = P(2) + P(4) == 5 

URMEI (03.3 F, 质量 控制 工程 师 考虑 确定 一 条 装配 线 是 否 失控 的 问题 . 在 此 例 中 , 我 们 讨论 
了 装配 线 上 一 个 、 两 个 或 一 般 地 个 产品 有 缺陷 的 概率 问题 . 现在 我 们 准备 求 装配 线 上 相继 的 两 个 
产品 都 有 缺陷 的 概率 . 假定 装配 线 失 控 且 生产 的 产品 20% 是 有 缺陷 的 . 

a， 如 果 从 装配 线 上 相继 取出 两 个 产品 , 它们 都 有 缺陷 的 概率 是 多 少 ? 

b. 如 果 从 装配 线 上 相继 取出 个 产品 , 所 有 都 是 有 缺陷 的 概率 是 多 少 ? 

E a $D 表示 产品 1 有 缺陷 事件 ，D， 表示 产品 2 有 缺陷 事件 . 两 个 产品 都 有 缺陷 事件 
是 交 Di T D. 由 于 假定 产品 的 生产 条 件 和 披 此 独立 没有 不 合理 ， 因此 两 个 产品 都 有 缺陷 的 概 
率 是 : 


中] 一 


P(D, D) - P(D;))P(D5) 2 (0.2) (0.2) = (0.2)2 20.04 
b. 令 D, 表示 装配 线 上 相继 到 达 的 第 i 个 产品 有 缺陷 事件 . 那么 装配 线 上 相继 的 三 个 产品 
都 有 缺陷 事件 是 事件 D, ND (根据 a) 和 事件 D, 的 交 . 假定 事件 Dj. D, 和 D, 是 独立 的 ,我 
们 有 : 
P(D ND, D4) P(D40D,) P(D) = (0.2)2(0.2) = (0.2)3 =0. 008 


注意 形式 ,你 可 以 看 出 装配 线 上 到 达 的 天 个 产品 都 有 缺陷 的 概率 是 D. nb, n = N D, 的 概 
A, BH 

P(D nD, ND) =(0.2) £z1,2,3, = 
应 用 练习 个 信息 估计 伊顿 电子 开关 装置 用 于 监测 电力 特性 


并 为 此 装配 线路 的 概率 . 


3.31 动力 设备 的 质量 监控 . Mechanical Engineeri 
动力 设备 的 质量 监控 . Mechanica nguneerung 3.32 出 售 电能 . 马里 兰 大 学 土木 和 环境 工程 系 的 研 


(2005 年 2 月) 报告 了 有 关 为 监测 工业 设备 的 质量 
而 对 无 线 网 络 需 求 的 内 容 . 例如 , 考虑 伊顿 公司 ， 
一 家 开发 分 布 式 产品 的 公司 . 伊顿 估计 卖 出 的 90% 
电子 开关 装置 能 够 监测 流 经 此 装置 的 电力 特性 . 伊 
顿 进一步 估计 在 倾向 于 监测 质量 的 电子 开关 装置 
的 买 家 中 , 90% 不 会 为 此 给 设备 装配 线路 . 利用 这 


究 员 利用 随机 动态 规划 确定 电力 的 最 优 负 荷 估计 
(Journal of Energy Engineering, 2004 年 4 月). 目的 
之 一 是 对 于 不 同 的 负荷 估计 确定 电力 供应 商 达 到 
或 超过 某 个 净利 目标 的 概率 . 该 研究 中 的 所 有 负荷 
估计 值 都 会 给 出 0.95 的 概率 . 考虑 两 个 不 同 的 电 
力 提供 商 ( 提 供 商 A 和 提供 商 B), 他 们 是 独立 的 . 


ko 
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ce 


a. 两 个 提供 商都 达到 他 们 净利 目标 的 概率 是 多 少 ? 

b， 两 个 提供 商都 没 达到 他 们 净利 目标 的 概率 是 多 少 ? 

c. 或 者 提供 商 A 或 者 提供 商 B 达到 他 的 净利 目标 
的 概率 是 多 少 ? 


.33 阅 入 探测 系统 . 当 一 个 奖 人 者 (比如 未 授权 访 


问 ) 试 图 进入 计算 机 系统 时 , 计算 机 阁 入 探测 系统 

(IDS) 提供 警报 . 由 两 个 独立 运行 的 冯 人 探测 系统 

(一 个 双 IDS) 组 成 的 系统 概率 估计 发 表 在 Journal of 

Research of the National Institute of Standards and Tech- 

nology (2003 年 11 - 12 A) E. 考虑 具有 系统 A 和 系 

FE B 的 双 IDS. 如 果 有 一 个 间 入 者 , 系统 A 以 0.9 的 

概率 发 出 警报 , 系统 B 以 0.95 的 概率 发 出 警报 . 如 

果 没 有 阁 入 者 , 系统 A 发 出 警报 ( 即 一 个 错误 警报 ) 

的 概率 是 0.2, 系统 B 发 出 警报 的 概率 是 0. 1. 

a 用 符号 写 出 4 个 概率 的 表达 式 . 

b， 如 果 有 一 个 冯 人 者 ， 两 个 系统 都 发 出 警报 的 概 
REED? 

c. 如 果 没 有 闻 人 者 ,两 个 系统 都 发 出 警报 的 概率 
是 多 少 ? 

d. 已 知 有 一 个 冶 人 者 , 至 少 有 一 个 系统 发 出 警报 
的 概率 是 多 少 ? 


-34 REREH 34. 基于 一 项 关于 酸雨 的 研 


R, 国家 酸雨 沉降 评价 项 目 (NAPAP) 估计 阿迪 朗 
达 克 湖 被 酸化 的 概率 为 0. 14. 已 知 阿迪 朗 达 克 湖 是 
酸性 的 , 这 个 湖 由 它 自 己 酸性 自然 形成 的 概率 是 
0. 25( Science News, 1990 年 9 月 15 H). 利用 这 个 
信息 求 阿迪 朗 达 克 湖 是 自然 酸性 的 概率 . 


-35 交 又 路 口 的 交通 量 . 从 加 速 车 道 通 往 高 速 公路 


的 并 道 过 程 构成 了 立体 交叉 交通 运行 的 一 个 重要 
方面 . 在 以 色 列 一 项 关于 并 行 和 浙 缩 式 立交 莲 道 的 
研究 搜集 了 被 并 车 道上 的 司机 接受 和 拒绝 的 交通 
时 滞 ( 其 中 时 滞 定 义 为 主要 交通 流 到 达 之 间 的 时 间 
间隔 ) 的 信息 . 数据 汇总 在 下 表 中 . 


一 -一 一 一 一 R l 
接受 第 一 次 ”拒绝 第 一 次 





立交 道 类 型 pp 时 洁 并 道 的 — 时 洁 并 道 的 
司机 个 数 。 司机 个 数 
HAR ”大 交通 量 16 -115 
小 交通 量 67 121 
FER ”大 交通 量 40 139 


小 交通 量 144 
一 
资料 来 源 : Polus, A, and Livnech，M.“ 高 速 公路 上 交通 流 
的 特征 ”. Journal of Transportation Engineering, 第 3 卷 , 第 
6 期 , 1985 ^E 11 H, p600-601 ( 4). 


[^] 


[^] 


a. TEXOBLEGE BU WEAR y EIB IM ER, 司机 接受 第 
一 个 时 滞 的 概率 是 多 少 ? 

b. 在 并 行 汇 合 路 口 处 , 司机 拒绝 第 一 个 时 灌 的 概 
率 是 多 少 ? 

c. 已 知 司机 在 交通 量 很 小 时 接受 第 一 个 时 滞 ， 这 
个 司机 在 并 行 汇合 路 口 的 概率 是 多 少 ? 


-36 中 性 粒子 的 反射 . 核 聚变 反应 设计 的 一 个 重要 


方面 是 中 性 粒子 在 真空 管道 中 的 输送 . 在 一 次 试验 

中 ， 通过 管道 末端 进入 的 粒子 无 障碍 的 运动 , 直到 

它们 与 管道 内 壁 碰撞 . 当 碰 撞 内 壁 时 ， 它们 或 者 散 

射 (反射 ) 或 者 被 内 壁 吸收 ( Nuclear Science and En- 

gineering, 1986 年 5 月 ). 对 于 某 种 类 型 的 管道 , 反 

射 概率 ( 即 一 颗粒 子 被 内 壁 反射 的 概率 ) 是 0. 16. 

a 如果 将 两 颗粒 子 释放 入 管道 ， 求 两 颗 都 被 反射 
的 概率 . 

b WRH 5 颗粒 子 释放 人 管道 , 求 所 有 5 颗 都 被 
吸收 的 概率 ， 

c. 为 了 计算 这 些 概率 ,a 和 b 中 的 简单 事件 要 求 有 
什么 假定 ? 


.37 玉米 种 子 . Economic Botany(1995 年 1 月 至 3 


月 ) 调 查 了 玉米 的 起 源 和 特征 . 从 玉米 穗 上 得 到 的 
种 子 携 有 单个 小 穗 或 成 对 小 穗 , 但 不 会 两 者 兼 有 . 
对 近 600 个 玉米 穗 进行 了 后 代 试验 , 得 到 如 下 的 信 
dh: 所 有 种 子 中 有 40% 携 有 单个 小 穗 , 60% 携 有 成 
对 小 穗 ; 单个 小 穗 的 种 子 有 29% 的 机 会 生产 单个 
小 穗 的 玉米 穗 ， 有 71% 的 机 会 生产 成 对 小 穗 的 玉 
米 穗 ; 成 对 小 穗 的 种 子 有 26% 的 机 会 生产 单个 小 
惩 的 玉米 穗 ， 有 74% 的 机 会 生产 成 对 小 穗 的 玉 
米 穗 . 
a. 求 一 个 随机 选择 的 玉米 穗 种 子 携 有 单个 小 穗 并 
生产 单个 小 穗 的 玉米 穗 概率 . 
b. 求 一 个 随机 选择 的 玉米 穗 种子 生 产 出 成 对 小 穗 
的 玉米 穗 概率 . 


38 测 谎 机 . 一 种 新 型 的 测 谎 机 ( 称 为 计算 机 声音 


压力 分 析 (CVSA) ) 已 经 间 世 . 制造 商 宣称 CVSA 有 
98% 的 精确 度 ， 且 不 同 于 测 谎 器 , 不 会 由 于 药物 和 
医学 因素 产生 错觉 . 但 是 , 由 美国 国防 部 进行 的 试 
验 发 现 CVSA 有 49. 8% 的 准确 率 , 比 纯粹 磁 运 气 略 
少 一 点 . ( Tampa Tribune , 1999 年 1 H 10 H. ) 假 定 
用 CVSA 测试 4 个 嫌疑 犯 的 诚实 性 , 旦 嫌疑 犯 的 反 
应 是 相互 独立 的 . 

a 如果 制 造 商 宣称 的 是 真 的 ，CVSA 正确 地 确定 所 

有 4 个 嫌疑 犯 诚实 性 的 概率 是 多 少 ? 

b. 如 果 制 造 商 宣称 的 是 真 的 , CVSA 对 4 个 嫌疑 犯 
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3. 


e 


中 至 少 一 个 给 出 不 正确 结果 的 概率 是 多 少 ? 

c. 假定 在 美国 国防 部 对 4 个 嫌疑 犯 进行 的 试验 中 ， 
CVSA 对 两 个 嫌疑 犯 给 出 了 不 正确 的 结果 . 利用 
这 个 结果 对 新 型 测 谎 机 的 真实 准确 率 作 出 一 个 
推断 . 

39 工作 压力 设计 . 传统 上 , 地 球技 术 工 程 师 为 了 

防止 倒塌 利用 工作 压力 设计 (WSD) 来 设计 安全 结 

构 . 一 项 研究 检查 了 传统 WSD 在 三 个 设计 领域 : 

土方 、 护 土 结构 和 挖掘 以 及 地 基 的 整体 安全 性 

( Canadian Geotechnical Journal, 1985 年 11 H). 下 

表 给 出 了 在 每 个 设计 领域 故障 的 概率 . 





设计 领域 故障 概率 
土方 0.01 
护 土 结 构 和 挖掘 0.001 
地 基 0. 0001 





考虑 由 三 个 设计 领域 组 成 的 WSD. (假定 任何 一 个 
设计 领域 的 故障 与 其 他 领域 的 故障 是 独立 的 . ) 
a. 在 土方 设计 领域 故障 或 者 在 护 土 结 构 和 挖掘 设 
计 领 域 故障 的 概率 是 多 少 ? 
b. 在 所 有 三 个 设计 领域 故障 的 概率 是 多 少 ? 
40 卡车 事故 研究 . Transportation Quarterly ( 1993 
年 1 月) 指出 了 一 些 卡 车 事故 的 研究 中 利用 的 使 人 
误解 或 不 合适 的 概率 分 析 . 考虑 下 面 从 一 篇 文章 摘 
取 的 部 分 ?, 你 能 找 出 概率 论证 方面 的 问题 吗 ? 
fido, 考虑 来 往 交 通 流 中 只 有 两 类 交通 工具 的 情 
况 : 大 卡车 占 20% ， 小 汽车 占 8096. 如 果 仅 考虑 两 
类 车 辆 事故 , 样本 空间 中 所 有 事件 发 生 的 概率 为 ; 
P( 卡 车 撞 卡 车 ) =P(TT) 20.20 x0.20 =0. 04 
P( 卡车 撞 小 汽车 ) = P( TC) =0. 20 x0. 80 =0. 16 
P( 小 汽车 撞 卡 车 ) =P(CT) =0. 80 x0. 20 =0.16 
P( 小 汽车 撞 小 汽车 ) = P(CC) =0. 80 x0. 80 =0. 64 
1.00 
许多 研究 员 [ 利用 计算 P(TT) + P( TC) + P(CT) = 
0.36] 得 出 结论 : 占 交通 量 20% 的 卡车 率 涉 到 所 有 
两 车 相 撞 事故 的 36% . 因此 占 交通 量 80% 的 小 汽车 
牵涉 到 所 有 两 车 相 接 事 故 的 100% -36% = 64%. 








可 选 做 的 应 用 练习 


3. 41 


在 Environmental Science & Technology th (1986 
4E 5 H), Joseph Fiksel 的 论文 研究 了 暴露 于 危险 
及 有 毒物 的 慢性 病 ( 如 癌症 和 先天 缺陷 ) 患者 的 补 

偿 问 题 . 正如 美国 司法 系统 所 关心 的 ,补偿 的 关键 

是 因果 关系 的 概率 ( 即 对 于 患者 而 言 ， 由 于 暴露 于 

危险 物质 引起 的 可 能 性 ). 通常 情况 下 , 为 了 法 庭 ` 

判决 补偿 ,因果 关系 的 概率 必须 大 于 0. 50. Fiksel 

给 出 了 某 些 不 同 环境 下 怎样 计算 因果 关系 概率 的 

fro. 

a. 如 Fikse 定义 的 ,“ 普 通 因果 关系 认为 单个 因素 
(如 石棉 绝缘 体 ) 的 存在 是 造成 结果 ( 如 间 皮 瘤 ) 
的 原因 . ”对 于 这 种 情形 , 定义 如 下 事件 ; 

D: {结果 (疾病 ) 发 生 |} 
A: | 因素 A 存在 | 
在 普通 因果 关系 下 , 如 果 4 发 生 , D 必定 发 生 . 
但 是 , MAR A 不 存在 时 , D 也 可 能 发 生 . 所 以 ， 
因素 A 的 因果 关系 概率 就 是 条 件 概率 PCATD). 
证 明 : 因素 A 的 因果 关系 概率 是 : 
P, =P, 
P 


1 


P(AID) = 


其 中 , P, 是 当 因 素 A 不 存在 时 , 结果 发 生 的 概 
率 ; P, 是 因素 A 或 者 存在 或 者 不 存在 时 , 结果 
发 生 的 概率 . CÈ: 对 于 流行 病 学 家 , P. 通常 称 
为 疾病 的 全 面 风 险 广 , P. - P, 称 为 由 于 因素 A 
的 存在 而 导致 的 额外 风险 . ) (提示 : 这 个 试验 
的 简单 事件 是 1D' NA, DNA, DOW HL, DAR 
事件 的 形式 给 出 P AP.) 

b. Fikse 将 同时 发 生 的 互 斥 因果 关系 定义 为 以 下 
情况 :“ 存 在 两 个 或 更 多 因果 关系 因素 , 但 是 所 
得 的 结果 只 能 是 这 些 因素 中 的 一 个 且 只 有 一 个 
引起 的 . ”考虑 两 个 因素 A 和 了 B, B 表示 存在 
因素 B 事件 . 在 这 个 情形 下 ,如果 4 或 者 B 发 
E, D 必定 发 生 , 但 是 4 Hl B 不 能 同时 发 生 . 
(EPA FI B J& 8 FE RS). 假定 当 4 和 8B 都 不 发 生 
BF, D 不 可 能 发 生 , WEH: 因素 A 和 B 的 因果 关 
系 概率 分 别 是 : 


O Bowman B. L. 和 Hummzer J. “ 用 来 确定 大 型 卡车 交通 事故 问题 量 级 的 数据 有 效 性 障碍 . ” Transportation Quarterly, 第 47 


卷 , 第 1 期 , 1993 年 1 月 , p. 40. 


Q Fiksel J.“ 受 害 人 补偿 ; 理解 不 明确 原因 的 问题 . ” Environmental Science and Technology, 1986 年 5 月 , 版 权 1986 属 美国 


化 学 会 . 经 许 翻印 . 


概率 
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P 
P(AID) => +P; 和 P(BID) =p +P, 
l 


其 中 , P, 是 当 因 素 A 存在 时 , 结果 发 生 的 概率 ; 
P, 是 当 因素 B 存在 时 , 结果 发 生 的 概率 . ( 提 
T: 这 个 试验 的 简单 事件 是 {D* 几 4° 路 B*, DNA 
nB', DNA nB). ) 

c. Fiksel 用 同时 联合 因果 关系 描述 更 现实 的 情况 ， 
“其 中 几 个 因素 对 结果 的 发 生起 着 不 同 程度 的 作 
用 . 例如 , 工作 场所 暴露 于 辐射 和 化 学 致癌 物质 
下 的 吸烟 者 可 能 患 上 肺 肿瘤 . 目前 , 还 不 可 能 确 
定 肿瘤 完全 是 由 一 个 因素 或 因素 组 合 造成 的 . ” 
对 于 这 种 情况 , 考虑 两 个 因素 A 和 B, 它们 对 D 
的 影响 是 独立 的 . 还 假定 如 果 4 或 或 二 者 都 





"3.7 贝 叶 斯 法 则 


RE, 那么 了 必定 发 生 ; MUR AI B 都 不 发 生 ， 
那么 DD 不 可 能 发 生 . 证 明 : 因素 A 和 了 的 因果 
关系 概率 分 别 为 : 
P, 
PAID) "PERLE, 

和 

P, 
其 中 , P. 是 因素 A 存在 时 , 结果 发 生 的 概率 ; 
P, 是 因素 B 存在 时 , 结果 发 生 的 概率 . (提示 : 
这 个 试验 的 简单 事件 是 1D* NA nnB, DNAN 
B°, DNA‘NB, DnAnB|.) 


P(BID) = 


利用 概率 进行 推断 的 早期 尝试 是 统计 方法 论 的 一 个 分 支 , 称 作 贝 叶 斯 统计 方法 的 基础 . 17 世纪 
中 叶 英 国 伟大 的 哲学 家 托马斯 ， 贝 叶 斯 所 用 的 逻辑 是 将 未 知 的 条 件 概率 P( B14) 转 换 为 已 知 的 条 件 


概率 P(A18). 用 下 面 的 例子 说 明 这 个 方法 . 


无 人 监控 系统 利用 高 科技 视频 装备 和 微 处 理 器 来 检测 冯 人 者 . 原型 系统 已 经 开发 且 在 武 
BEKI PIMEN, 这 个 系统 的 设计 以 0. 90 的 概率 发 现 闻 信者. 但是, 设计 工程 师 希 望 这 个 概率 根 
据 气 候 条 件 变 化 . 每 当 检测 到 间 和 人 者 时 ,系统 将 自动 记录 当时 的 气候 条 件 . 基于 一 系列 控制 测试 ， 即 
在 不 同 气 候 条 件 下 , 阁 人 者 进入 工厂 , 得 到 下 面 的 信息 : 已 知 系统 实际 上 检测 到 闯 入 者 时 ， 天气 有 
75% 是 晴天 , 20% ERÉ, 5% 是 雨天 . 在 系统 不 能 检测 到 闻 人 者 时 , 天气 有 60% 是 上 晴天, 30% 是 阴 
K, 10% 是 雨天 . 利用 这 些 信息 , 求 已 知 天 气 为 雨天 条 件 下 , 检测 到 闻 人 者 的 概率 .〈 假 定 闻 人 者 已 经 


赦免 . ) 


解 定义 忆 为 系统 检测 到 冯 和 人 者 事件 , 那么 D° 表示 系统 没有 检测 到 闻 入 者 事件 . 我 们 的 目标 是 
计算 条 件 概 率 POIR). 根据 问题 的 描述 , 可 以 得 到 下 面 的 信息 ; 


P(D) =0. 90 

P( 晴 天 1D) =0. 75 
P( HRID) =0. 20 
P( 雨 天 1D) =0.05 


P(D*) =0. 10 

P( 晴 天 1D*) =0. 60 
P( 阴 天 1D*) =0.30 
已 (雨天 1De) 20.10 


P( 雨 天 MD) = P(D)P( 雨 天 1D) = (0.90)(0.05) =0. 045 


P( 雨 天 MD*) =P(D*)P( 南 天 1D*) =(0.10)(0.10) =0.01 
雨天 事件 是 两 个 互 斥 事件 (雨天 mD) 和 (雨天 De) 的 并 . 因此 ， 
P( 雨 天 ) 2 P(W nD) + PCR QD) =0.045 +0.01 =0. 055 


现在 我 们 应 用 条 件 概率 公式 可 以 得 到 ， 
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P(WXnD) P(RRAOD) _ 0.045 
PODIBIAX) = PORR) (雨天 mD) «PC nD') 0.055 
因此 在 雨天 的 气候 条 件 下 ,原型 系统 能 以 0. 818, 一 个 低 于 设计 概率 0. 90 的 值 检 测 到 闻 人 和 者. 

例 3. 19 中 所 用 的 方法 称 为 贝 叶 斯 方法 ， 当 观测 到 的 事件 巨 发 生 , 伴随 着 个 互 斥 且 完备 的 自 
然 状 态 (或 事件 )4，， A5, cn, A, 中 的 任何 一 个 发 生 时 ， 可 以 应 用 此 情况 . 求 合适 的 条 件 概 率 公 式 
如 下 框 格 所 给 .~ 


=0. 818 








贝 叶 斯 法 则 
给 定 上 个 互 斥 且 完备 的 自然 状态 (事件 )4)， A, e, AL, 和 一 个 观测 到 的 事件 EE, 那么 PCIE), i=1, 
2, Uy kN. 
P(AnE) | P(A,) PCEIA,) 
P(E) ~ P(A))P(EIA) € PCA,)P(EIA,) € P(A)PCEÍA,) 





P(A, 1E) = 








- 


将 贝 叶 斯 法 则 用 于 例 3. 19, 观测 到 的 事件 是 | 两 天 | , 互 斥 且 完备 的 事件 是 D( 检 测 到 间 信 者) 
和 D*( 未 检测 到 间 入 者 ). 因此 ,公式 


P(DI 雨 天 ) = 





P(D)P( 雨 天 1D) 
= (0. 90) (0. 05) _ 
= (0.90) (0.05) + (0. 10) (0. 10) 7 ® 818 


[ 注 : 在 练习 3. 92 中 , 要 利用 贝 叶 斯 法 则 求 P(DVWEX)RIP(DIBRX). ] 


@ mas, b. EATS He MO Hn JE fE F Ü 3 Es BE 35 AER 
.°, qe z 3m ° 
3.42 dune. 非 破坏 性 评估 (NDE) RR 的 ， 根据 数据 它 是 海峡 狂 鱼 (CC) 的 概率 为 


通过 非 侵害 的 诊断 , 例如 X 射线 计算 机 体 层 摄影 P(CCI275 -300) = 0.775, P ( CC | 305 ~ 
N N _ 325) =0.77, K P( CCI330 ~350) =0. 86. 如 
术 、 超 声波 及 声 发 射 来 定量 刻画 材料 .组织 和 结构 0. b 
' 3 - - A 15 e (0 88 B: t 48 B: J, HJ BN PS I PË fs 
的 方法 . 最 近 , NDE 用 来 探测 钢 铸件 缺陷 . (JOM, hs I 
. 的 , 那么 它 是 在 上 游 275 ~ 300 mile 处 捕获 的 
2005 年 5 月 . ) 假定 当 瑕 疫 确 实 存在 时 ，NDE 探测 MERED 
#|“— AMRA (MIER E d BOR RI — 1 38 9) 的 








3.44 运动 员 的 药物 检验 , 由 于 药物 检验 程序 的 不 精 
MEO OT POIN. 还 假定 当 事 实 。 。 确 性 ( 例如， 假 阳 性 和 假 胃 性 ) 在 医学 领域 eom 


检验 的 结果 只 表示 医师 诊断 的 一 个 因素 . 但 是 对 奥 
林 匹 克 运 动员 进行 非法 药物 使 用 ( 如 兴奋 剂 ) 的 检 
验 时 , 单个 检验 结果 就 用 于 禁止 运动 员 参 加 比赛 . 
在 Chance(2004 年 春 ) ， 德 克 萨 斯 大 学 的 生物 统计 
学 家 D. A. Berry 和 工 .Chastain 演示 了 贝 叶 斯 法 则 
用 于 推断 奥林匹克 运动 员 服 用 举 丸 激素 . 他 们 利用 
下 面 的 例子 , 在 包含 1000 个 运动 员 的 总 体 中 , 假 
AE 100 个 非法 使 用 了 睾丸 激素 . 在 使 用 者 中 , 假定 
有 50 个 对 睾丸 激素 的 检验 显示 阳性 . 在 未 使 用 者 
H, 假定 有 9 个 检验 结果 显示 阳性 . 
a 已 知 一 个 运动 员 是 使 用 者 , REALNE 
检验 显示 阳性 的 概率 . (这 个 概率 代表 药物 检验 
的 敏感 度 . ) 


-EARFETEXEDIERT, NDE 探测 到 “一 个 得 分 ”的 概率 
是 0.005.( 称 为 误 报 概率 . ) 过 去 的 经 验 表明 在 每 
100 4F55:3& fj P tb BLA BUE. 如 果 对 于 某 个 钢 铸 
fE, NDE 探测 到 “一 个 得 分 ”, WAER ETETERH 
站 的 概率 是 多 少 ? 

3.43 和 鱼 的 污染 . 参看 练习 3. 29 美国 陆军 工程 兵团 
关于 田纳西 河 ( 亚 拉巴 马 州 ) 中 污染 鱼 的 DDT 的 
研究 . 

a. 仅 考 虑 从 田纳西 河 捕获 的 污染 鱼 , 数据 表明 52% 
的 鱼 是 在 上 游 275 ~ 300 mile 处 发 现 的 , 39% 在 上 
游 305 ~325 mile 处 发 现 的 , 9% 在 上 游 330 ~ 350 
mile 处 发 现 的 . 利用 这 些 百分数 确定 概率 P(275 
-300), P(305 ~325) 和 P(330 ~350). 
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b. 已 知 一 个 运动 员 是 未 使 用 者 , KELME 两 个 系统 发 出 警报 , 探测 到 间 人 者 的 概率 是 多 少 ? 
物 检验 显示 阴性 的 概率 . (这 个 概率 代表 药物 检 3.47 修理 计算 机 系统 . 一 所 大 学 暂时 关闭 商学 院 计 
验 的 特异 性 . ) 算 机 系统 的 局 域 网 (LAN) 以 便 维修 . 以 前 的 关闭 是 

c. 如 果 一 个 运动 员 的 睾丸 激素 的 测试 结果 是 阳性 ， 由 于 硬件 故障 、 软 件 故 障 或 电力 故障 . 维护 工程 师 
利用 贝 叶 斯 法 则 求 这 个 运动 员 确 实 使 用 违禁 药 确定 硬件 、 软 件 和 电力 问题 的 概率 分 别 是 0.01, 
的 概率 . (这 个 概率 代表 药物 测试 的 阳性 预 0.05 和 0. 02. 他 们 也 确定 了 如 果 系 统 遇 到 硬件 问 
测 值 . ) : 题 , 以 73% 的 机 会 关闭 . 类 似 地 , 如果 软 件 问题 发 

3.45 ”估计 任务 成 本 中 的 错误 . 一 个 建筑 公司 雇佣 了 Æ, 以 12% 的 机 会 关闭 ; 如 果 电 力 故障 发 后 ,系统 

三 个 销售 工程 师 . 工程 师 1, 2 和 3 分 别 估计 了 所 有 以 88% 的 机 会 关闭 . 局 域 网 的 当前 关闭 是 由 于 硬件 

公司 投标 任务 成 本 的 30% , 20% 和 50%. 对 = |， 故障 ? 软件 故障 ? 电力 故障 的 概率 是 多 少 ? 

2,3, 定义 ,为 由 工程 师 i 估计 任务 事件 . 下 面 的 3.48 购买 微 芯 片 . 台式 或 个 人 手提 电脑 (PC ) 的 一 

概率 描述 了 工程 师 们 在 估计 成 本 时 犯 严 重 错误 的 个 重要 部 件 是 微 芯片 . 下 表 给 出 了 某 个 PC 制造 商 





EX: 从 ?7 个 不 同 的 供给 商 购 买 的 微 芯片 的 比例 . 
P(RHRIE) 20.01, P(#8i21E,) =0.03 和 ^ gas E BW 

PCRHRIE,) =0. 02. S, 0.15 
a. 在 估计 任务 成 本 时 ,如果 某 个 投标 出 现 严重 错 s, 0 05 
误 , 这 个 错误 由 工程 师 1 造成 的 概率 是 多 少 ? s 0 10 
b 在 估计 承包 成 本 时 ， 如 果 某 个 投标 出 现 严 重 错 s 0.20 
B, 这 个 错误 由 工程 师 2 造成 的 概率 是 多 少 ? s 20 

c. 在 估计 承包 成 本 时 ， 如 果 某 个 投标 出 现 严重 错 s, 0.20 

误 , 这 个 错误 由 工程 师 3 造成 的 概率 是 多 少 ? s, 0.18 


d. 根据 a~e 的 概率 , 哪个 工程 师 最 有 可 能 为 重大 
错误 负责 ? 

3.46 HARMAA. 参看 练习 3.33, Journal of Re- 
search of the National Institute of Standards and Tech- 
nology( 2003 年 11 -12 月 ) 关 于 独立 的 双 冯 人 探测 
系统 的 研究 . 如 果 存 在 奖 入 者 ， 系统 A 以 0.9 的 概 b 
RRE, RA B 以 0.95 的 概率 报警 . 如 果 没 有 冯 
入 者 , 系统 A 以 0.2 的 概率 报警 ,系统 B 以 0.1 的 
概率 报警 . 现在 ,假定 有 痿 人 者 的 概率 是 0.4. 如 果 





a. 已 知 由 7 个 供给 商 生 产 的 有 缺陷 微 芯片 的 比例 
分 别 为 0.001, 0. 0003 , 0. 0007, 0.006, 0. 0002, 
0. 0002 和 0. 001. 如 果 发 现 一 个 PC 微 芯片 故障 ， 
最 可 能 是 哪个 供给 商 的 责任 ? 

. 假定 7 个 供给 商 以 相同 的 比例 0. 0005 生产 有 缺 
陷 的 微 芯片 . 如 果 观 测 到 一 个 PC 微 芯 片 故 障 ， 
那么 哪个 供给 商 最 可 能 负责 ? 


3.8 计数 法 则 


在 3. 2 节 中 我 们 指出 , 有 时 试验 包含 太 多 的 简单 事件 ， 以 致 将 它们 全 部 列举 出 来 是 不 切实 际 的 . 
但 是 , 许多 这 样 的 试验 具有 相同 特征 的 简单 事件 . 如 果 你 能 设计 一 个 计数 法 则 数 清 这 种 试验 的 简单 
事件 个 数 , 这 可 能 有 助 于 问题 的 解决. 

DREJ 一 个 产品 ( 比如 网 络 计算 机 系统 的 硬件 ) 可 以 通过 四 条 不 同 航线 运输 ,日 每 条 航 线 可 以 通 
过 三 个 不 同 路 线 运输 . 有 多 少 种 不 同 的 方法 来 运输 产品 ? 

解 ”运输 产品 的 不 同方 法 的 图 表示 有 助 于 数 清 方法 的 数目 , 这 称 作 决策 树 表示 法 ， 见 图 3. 13. 
在 起 点 处 (第 一 步 ) 存 在 4 个 选择 (不 同 航线 ) 开始 旅途 . 一 旦 我 们 选择 了 -条 航线 (第 二 步 ) WEE 
三 个 选择 (不 同 路 线 ) 完成 运输 并 到 达 目 的 地 . 这 样 , 决策 树 清楚 地 显示 了 存在 (4) (3) = 12 种 不 同 的 
方法 来 运输 产品 . 
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解决 例 3. 20 的 方法 可 以 推广 到 具有 不 同 元 素 集合 的 任意 多 个 步骤 的 情况 . 给 出 以 下 的 乘法 
法 则 

定理 3. 1 (乘法 法 则 ) ”你 有 上 个 集合 ,第 一 个 集合 有 ni AER, 第 二 个 集合 有 ns 个 元 素 ，…， 
第 万 个 集合 有 ns 个 元 素 . 假定 你 想 从 个 集合 的 每 一 个 中 选取 一 个 元 素 形成 上 个 元 素 的 样本 .那么 
可 能 形成 的 不 同样 本 个 数 是 : 

ninan3 n, 

定理 3. 1 的 简要 证 明 检查 表 3.4 即 可 相当 容易 地 得 到 定理 3. 1 的 证 明 . 由 两 个 元 素 集合 (o ， 
a), U ay Fibi, bas ons bu ) 形 成 的 每 一 对 相应 于 表 3. 4 中 的 一 个 单元 . 

H Patas n ITA nm 列 , 因此 共有 mm 对 , 相应 于 表 中 nin 个 单元 . 为 了 将 证 明 推广 到 k=3 
的 情况 ， 注意 ， 由 三 个 元 素 集 合 a ，C2， "Qn; b, , bz, Ut, b, 和 Cis Co, "5 c, , JÉ UIT) — 74H 1t 
等 于 ab; ER — c TRONY 由 于 存在 (nin2) 个 aib; EUR ns 个 。 元 素 , 我 们 可 以 形成 (nn )n = 
ninn 个 三 元 组 , 它们 由 一 个 a 元 素 , 一 个 5 元 素 ,一 个 c 元 素 组 成 . 对 于 任意 个 集合 的 乘法 法 则 ， 
可 以 用 数学 归纳 法 证 明 . 我 们 将 这 个 证 明 留 作 练习 . 
"2 





表 3.4 a,28,-, an 和 
b, , bz, `. bu 的 组 合 

















b, b, b; e bnz 
a ab, ab, ab, e aba 
a, abı 
ay asb, 
Qn apb ... ... e a,b 


n] n] nl ny 





图 3.13 运输 问题 的 决策 树 


一 共有 20 个 候选 人 竞争 三 个 不 同 的 机 械 工程 师 职位 E, E, A E,. 你 有 多 少 种 不 同方 法 
分 配 这 些 职位 ? 
解 ” 这 个 例子 由 以 下 k=3 个 集合 组 成 ; 
”集合 1: 担任 职位 E, 的 有 效 候选 人 . 
集合 2: 剩 下 的 担任 职位 E, 的 有 效 候 选 人 (在 El 有 人 以 后 ). 
集合 3: 剩 下 的 担任 职位 E, 的 有 效 候选 人 (在 El 和 EE, 有 人 以 后 ). 
集合 中 的 元 素 个 数 为 n =20, n; 219, ns =18. 因此 , 分 配 三 个 职位 的 不 同方 法 个 数 为 ， 
ninan; = (20) (19) (18) 26840 
考虑 一 个 试验 , 从 装配 线 上 选择 10 个 产品 来 检查 ， 每 个 产品 分 为 有 缺陷 的 (DD) 或 者 无 缺 
PERION). (回忆 例 3.8) 证 明 这 个 试验 一 共有 210 = 1024 个 简单 事件 . 
解 ” 这 个 试验 有 k=10 个 元 素 集 合 . 每 个 集合 包含 两 个 元 素 , 有 缺陷 的 和 无 缺陷 的 . 因此 , 试验 
存在 


t 


(2) (2) (2) (2) (2) (2) (2) (2) (2) (2) =210 =1024 


概 率 7 





个 不 同 结果 (简单 事件 ). 
假定 有 5 个 不 同 的 太空 飞行 计划 , 每 个 计划 需要 一 名 宇航 员 . 假设 没有 宇航 员 能 够 执行 
两 个 以 上 的 太空 计划 , 那么 从 全 国 最 好 的 100 名 宇航 员 中 挑 5 名 , 分 配 到 5 个 太空 计划 中 , 共有 几 种 
不 同方 法 ? 

解 ” 我 们 可 以 用 乘法 法 则 解决 这 个 问题 . 对 于 第 一 个 飞行 计划 , 所 有 100 各 字 航 员 都 有 当选 希 
望 , 在 第 一 个 飞行 计划 选择 了 一 名 宇航 员 后 , 对 第 二 个 飞行 计划 有 99 名 当选 希望 , 等 等 . 因此 , 选择 
5 名 字 航 员 进行 5 次 太空 飞行 的 不 同方 法 的 总 个 数 为 : 

ninnanans = (100) (99) (98) (97) (96) =9 034 502 400 

将 元 素 以 不 同 次 序 排 成 一 列 称 作 一 个 排列 . 因此 , 对 于 例题 3. 23, 我 们 看 到 从 一 个 包含 100 + 
元 素 的 集合 中 选择 5 个 元 素 ( 宇 航 员 ) 进行 排列 的 方法 超过 了 90 47! 

定理 3. 2 (排列 法 则 ) 给 定 一 个 包 舍 N 个 不 同 元 素 的 集合 ， 从 这 N 个 元 素 中 选择 所 个 并 将 它 
们 放 在 严 个 位 置 上 ， 从 N 个 元 素 一 次 取 叶 个 的 不 同 排列 个 数 记 作 PN, 它 等 于 

N! 

(N-n)! 
HP n! 2n(n-1)(n-2)--(3) (22 (D) , RE n 的 阶乘 . (例如 , 51!25-4-3-2-1-120. )0! iE 
X 1. 

定理 3. 2 的 证 明 定理 3.2 是 例题 3. 23 的 解 的 推广 . 总 共有 NN 种 方法 填充 第 一 个 位 置 . 然后 ， 
共有 入 -1 个 方法 填充 第 二 个 位 置 , N -2 个 方法 填充 第 三 个 位 置 , …，(N -n+1) 个 方法 来 填充 第 n 
个 位 置 . 应 用 乘法 法 则 可 以 获得 

N! 


N _ _ _ ... -n = ——F 
P, =(N)(N-1)(N-2)-: (N-n+1) (N-m1 


考虑 下 面 的 运输 工程 问题 : 你 想 从 一 个 起 点 依次 通过 五 个 城市 中 的 每 一 个 , 且 比 较 不 同 
路 径 的 距离 和 平均 速度 . 必须 比较 多 少 条 不 同 路 径 ? 

解 将 城市 记 作 Ci, Co, --, Cs. 那么 从 起 点 移动 到 C, , 再 到 C, , 到 C, , 到 Cs, 到 Cs 的 一 条 路 
径 记 作 CC, C C, Cs. 路 径 的 总 条 数 等 于 你 能 够 将 N = 5 个 城市 安置 在 n=5 个 位 置 上 的 方法 个 数 . 这 
个 数 是 : 


PY =N(N-1)(N-2)--:(N-n+1) = 





! ! 453.2. 
PVP 31 0.51 .5:4:3:2-1 jg 


(5-5)! O! -. 1 
(注意 0!1 =1). ' 
有 4 个 系统 分 析 员 , 你 必须 指派 三 人 到 工作 1, 一 人 到 工作 2. 进行 这 种 指派 的 方法 有 多 
少 种 ? 

解 首先 , 假定 每 个 系统 分 析 员 将 指派 到 一 个 不 同 的 工作 . 那么 利用 乘法 法 则 , 我 们 知道 将 这 些 系 
统 分 析 员 指派 到 4 个 不 同 工 作 的 方法 共有 (4) (3) (2) (1) =24 种 . 这 24 种 方法 被 分 成 4 组 列 在 表 3.5 中 
(其 中 ABCD 表示 系统 分 析 员 A 被 分 配 到 第 一 个 工作 ; 系统 分 析 员 B 被 分 配 到 第 二 个 工作 等 )、 

现在 , 假定 前 面 三 个 位 置 代表 工作 1, 最 后 一 个 位 置 代表 工作 2. 我 们 可 以 看 到 所 有 列 在 第 1 组 
中 的 代表 感 兴趣 的 相同 试验 结果 ， 即 系统 分 析 员 A. B 和 C 分 配 到 工作 1 且 系 统 分 析 员 D 分 配 到 工 
作 2. 类 似 地 , 列 在 第 2 组 的 是 等 价 的 , 第 3 组 、 第 4 组 也 是 等 价 的 . 因此 , 将 4 个 系统 分 析 员 分 配 到 
两 个 工作 仅 有 4 种 不 同方 法 , 见 表 3. 6. 
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为 了 推广 例 3. 25 所 得 的 结果 , 我 们 指出 最 后 的 结果 可 以 由 下 式 得 到 ; 


(4)(3)(2)(D 4 表 3.5 将 系统 分 析 员 分 配 到 4 个 工作 的 方法 
(3)(2)(1)(1) — TM MATOS TB) 
第 1 组 第 2 组 第 3 组 第 4 组 





(4) (3)(2)( 1) 是 系统 分 析 员 指派 到 4 ARATE DD IRL ORI fid 
的 方法 (排列 ) 个 数 . 除 以 (3)(2)(1) 是 为 了 去 除 由 cpp apee o apes opu 
于 三 个 系统 分 析 员 指 派 到 相同 工作 而 重复 的 排列 。 Bacp pap capg on 


再 除 以 (1) 相应 于 系统 分 析 员 指派 到 工作 2. BCAD BDAC CDAB CDBA 
定理 3.3 (分割 法 则 ) — 462 N 个 不 同 元 素 CABD DABC DACB DBCA 
的 集合 , 将 它们 分 成 个 集合 , 第 一 个 集合 包含 n CBAD DBAC DCAB DCBA 


MER, 第 二 个 包 合 n AAR, =, 第 上 个 集合 包 


表 3.6 将 三 个 系统 分 析 员 分 配 到 工作 1 和 
En, 个 元 素 . 不 同 的 分 割 方法 个 数 为 ， | 


一 个 系统 分 析 员 分 配 到 工作 2 的 方法 





N! 
ml na! nl 工作 1 工作 2 
HP n, +n tee +n, = N. ABC D 
定理 3. 3 的 证 明 — A 等 于 将 个 不 同 元 素 分 ABD c 
成 个 集合 的 方法 个 数 . 我 们 想 要 证 明 s" I 
N! — —— -一 -~ 
nil no! + nk! 


写 出 将 N 个 不 同 元 素 安 排 到 个 位 置 的 不 同方 法 的 表达 式 , 我 们 就 可 以 求 出 4. 利用 定理 3.2, 不 同 
方法 的 个 数 是 : 
! ! 
PA= Cw Ayr" or N! 
但 是 , 根据 定理 3. 1, PN 也 等 于 乘积 
Pr=N!=(A)(n l) Gai D a!) 
其 中 4 表示 将 六 个 元 素 分 割 成 大 个 分 别 包含 nn ，72，…， 呈 个 元 素 的 集合 的 方法 个 数 ; n! 表示 将 
n, 个 元 素 安 排 到 第 1 组 的 方法 个 数 ; ni! 表示 将 n, 个 元 素 安排 到 第 2 组 的 方法 个 数 ; enu! 表示 将 
ny 个 元 素 安 排 到 第 组 的 方法 个 数 . 解 4 得 到 要 求 的 结果 : 


! 
A= No 
nm! nj! ... n,! 


CEA 假设 有 12 个 系统 分 析 员 , 并 且 你 想 将 其 中 3 个 指派 到 工作 1, 4 个 指派 到 工作 2, 5 个 指 
派 到 工作 3. 有 多 少 种 方法 来 作出 这 种 安排 ? 
解 对 于 这 个 例子 , k=3( 相 应 于 k=3 RETE). N=12, ni =3, m =4, ns =5. 那么 将 系统 
分 析 员 指派 到 各 项 工作 的 不 同方 法 的 个 数 为 ， 
1 ! . * ]10-..... . . 
nj! "| n! 3! MEE SEICE SETE 4 5 2.1) 27720 
DEEA 从 一 批 25 个 锡 铝 焊接 点 中 选择 4 个 , 共有 多 少 个 样本 可 以 进行 强度 测试 ? 
E 对 于 这 个 例子 , k=2( 相 应 于 必须 选择 的 m =4 个 焊接 点 以 及 不 必 选 择 的 n, =21 个 焊接 
M) N =25. 那么 , 从 25 个 焊接 点 中 选择 4 个 的 不 同方 法 个 数 是 ， 
N! - 25! _ 25 - 24 . 23.……. 3.2.1 - 12650 
nil na! (4!)(21!) (4-:3-2-1)(21 >20- 2-1) 
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由 例 3. 27 一 一 将 一 个 包含 N 个 元 素 的 集合 分 割 成 上 = 2 组 (包含 在 样本 中 以 及 不 在 样本 中 的 元 
素 ) 一 一 所 阐述 的 分 割 法 则 的 特殊 应 用 是 非常 普遍 的 . 因此 , 将 一 个 元 素 集 合 分 割 成 两 个 部 分 的 不 同 
方法 的 计数 法 则 , 我 们 给 出 一 个 不 同 的 名 字 一 一 组 合法 则 . 
定理 3. 4( 组 合法 则 ) ”一 个 个 元 素 的 样本 是 从 太 个 元 素 的 集合 中 选择 的 . 那么 从 NN 个 中 选择 
n ACER aknet), 它 等 于 
NY N! 
KLIE 
注意 , n 个 元 素 的 取出 次 序 并 不 重要 . 
定理 3. 4 的 证 明 定理 3.4 的 证 明 可 以 由 定理 3. 3 直接 得 到 . 从 WN 个 元 过 的 集合 中 选择 个 元 
素 的 样本 等 价 于 将 NN 个 元 素 分 割 成 z=2 组 : 选择 作为 样本 的 ”个 元 素 以 及 未 被 选择 的 剩 下 (N — n) 
个 元 素 . 因此 , 应 用 定理 3. 3, 我 们 得 到 : 
NN! 
( ) i-i 
从 100 个 申请 者 的 组 中 雇用 5 个 销售 工程 师 , 可 以 有 多 少 种 方法 (组 合 ) 选 择 5 个 销售 工 
程 师 ? 
解 ”这 等 价 于 从 N= 100 个 元 素 的 集合 中 选择 n=5 个 元 素 的 样本 . 因此 , 方法 的 个 数 就 是 从 100 
个 申请 者 中 选择 5 个 的 可 能 组 合 数 , 或 者 


n 








(9. 1001 — 100 - 99 - 98 - 97 -96 -95 > 36 eee 2-1 
5] (5)0(95)  (5:4-3-2-1)(95 94... 1) 
100 - 99 - 98 - 97 - 96 
= $.4.3.2.i1 "175287520 


将 这 个 结果 与 例 3. 23 进行 比较 , 我 们 发 现 从 100 个 元 素 中 选 5 个 的 排列 个 数 超过 了 90 47. 由 于 
元 素 的 顺序 不 影响 组 合 ,因此 组 合 数 比 排列 数 少 . 

在 处 理 一 个 概率 问题 时 ， 你 应 该 仔细 检查 试验 以 便 确定 是 否 可 以 应 用 这 节 所 讨论 的 一 个 或 多 个 法 
MJ. 这 些 法 则 总 结 如 下 , 我们 将 在 例 3. 29 和 例 3. 30 中 阐述 怎样 利用 这 些 法 则 来 解决 一 个 概率 问题 . 





计数 法 则 的 总 结 
.乘法 法 则 : 从 天 个 大 小 分 别 为 由， 站， …， ni 的 每 个 集合 中 抽取 一 个 元 素 ， 那 么 不 同 结果 的 个 数 为 :; 
ninn ny 
.排列 法 则 : 从 WN 个 元 素 的 集合 中 抽取 nn 个 元 素 并 将 这 个 元 素 按 不 同 次 序 排列 ,那么 不 同 结 果 的 个 
BU: 


= 


N 


kN! 
(N-n)! 


. DHEN: 将 几 个 元 素 的 集合 分 割 成 分 别 包含 下 ， 友 ，…, n On emi een SN) AER k A, 
那么 不 同 结果 的 个 数 为: 





US 


N! 


n, ! nj! Ung! 


.组 合法 则 : JUN AG 8 6 FARN AER, 不 考虑 这 个 元 素 的 次 序 , 那么 不 同 结果 的 个 数 为 


+ 
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(GR: 组 合法 则 是 分 割 法 则 k=2 时 的 一 个 特殊 情况 . ) 





LEE] 委托 一 家 计算 机 评级 机 构 评 出 平板 液晶 显示 器 的 3 个 最 好 商标 , 这 项 研究 一 其 包括 了 10 


个 商标 . 


a. 计算 机 评级 机 构 可 以 有 多 少 种 不 同 的 方法 完成 最 后 的 排序 ? 

b， 如 果 评 级 机 构 不 能 区 分 出 不 同 的 商标 , 从 而 最 后 的 排序 是 偶然 的 , 那么 公司 2 的 商标 以 多 大 
概率 排 在 第 1 位 ? 前 3 位 呢 ? 

解 a 由 于 评级 机 构 是 从 一 个 包含 10 个 元 素 ( 商 标 ) 的 集合 中 选择 3 个 元 素 并 将 这 3 个 元 素 按 
不 同 的 次 序 排列 , 我们 利用 排列 法 则 来 求 不 同 结 果 的 个 数 : 


10 10! 


b. 感 兴趣 事件 概率 的 计算 步骤 如 下 : 


步骤 1 
步骤 2 
步骤 3 


步骤 4 


步骤 5 


试验 是 从 10 个 平板 液晶 显示 器 商标 中 选择 3 个 并 对 它们 进行 排序 . 

简单 事件 太 多 , 无 法 一 一 列举 出 来 . 但 是 , 根据 a 我 们 知道 这 个 试验 有 720 个 不 同 结果 
( 即 简单 事件 ). 

如 果 假 定 评级 机 构 确 定 排序 是 随机 的 , 那么 这 720 个 简单 事件 应 该 以 等 概率 发 生 . 因此 ， 


P( 每 个 简单 事件 ) o 
感 兴趣 的 事件 是 公司 Z 的 商标 排 在 第 1 位 . 我 们 称 这 个 事件 为 事件 A. 导致 事件 4 发 生 
的 简单 事件 的 列表 非常 长 ,但 是 事件 4 中 包含 的 简单 事件 的 个 数 可 以 通过 将 事件 4 分 
成 两 部 分 来 确定 : 


公司 Z 的 商标 | 9 个 其 他 商标 
i : ⁄ N 
第 一 名 第 二 名 第 三 名 
只 有 一 种 可 能 性 (Pg nsn 
E 
1:72 = 72 个 简单 事件 


因此 , 事件 4 可 以 有 72 种 不 同 的 方式 发 生 . 

现在 定义 8 为 公司 Z 的 商标 排 在 前 三 名 事件 . 由 于 事件 B 只 表示 商标 Z 出 现在 前 三 名 中 ， 
我 们 重复 上 面 的 计算 , 固定 商标 Z 在 第 2 名 位 置 , 然后 在 第 3 名 位 置 我 们 可 以 得 到 事件 
B 包含 的 简单 事件 个 数 为 3(72) =216. 

最 后 一 步 是 计算 事件 4 和 8 的 概率 . 由 于 720 个 简单 事件 是 等 可 能 发 生 的 , 我 们 得 到 ; 


pia) = 事件 4 中 简单 事件 的 个 数 72 _ 1 
所 有 简单 事件 的 个 数 72010 





类 似 地 ， 





216 3 
P(B) -720^10 
| 例 3. 30 | 参看 例 3. 29, 假定 计算 机 评级 机 构 的 目的 是 从 10 个 平板 液晶 显示 器 中 选择 前 3 个 , 但 是 
不 对 它们 进行 排序 . 
a， 评 级 机 构 选择 平板 液晶 显示 器 作为 前 3 名 的 方法 有 多 少 种 ? 
b. 假定 评级 机 构 是 从 10 个 商标 中 随机 进行 选择 , 其 中 公司 X 的 商标 有 2 个 , 那么 公司 X 恰 有 1 
个 商标 排 在 前 3 名 的 概率 是 多 少 ? 至 少 1 个 呢 ? 
解 
a. 由 于 评级 机 构 从 10 个 元 素 (商标 ) 中 选择 3 个 元 素 , 且 不 考虑 顺序 , 因此 可 以 应 用 组 合法 则 
来 确定 不 同 结果 的 个 数 : 





10 ! «9. 
[s] (0217 s 1 = 120 
b. 按照 如 下 5 步 进行 : 

步骤 1 试验 是 从 10 个 商标 中 选择 3 个 (但 不 排序 ). 

步骤 2 这 个 试验 有 120 个 简单 事件 . 


步骤 3 由 于 选择 是 随机 的 , 因此 每 个 简单 事件 是 等 可 能 的 ; 


P( 每 个 简单 事件 ) = T 


步骤 4 定义 事件 4 和 B 如下: 
A: 1 公司 X 恰 有 一 个 商标 人 选 | 
B: {公司 X 至 少 有 一 个 商标 人 选 | 
由 于 每 个 简单 事件 是 等 可 能 发 生 的 , 因此 为 了 确定 事件 4 和 B 的 概率 , 我 们 只 需 知道 
它们 包含 的 简单 事件 的 个 数 . 对 于 事件 A, 恰好 选择 公司 X 的 一 个 商标 , 且 在 其 余 的 8 
个 商标 中 选择 2 个 . 因此 可 以 将 4 分 成 两 部 分 ， 


公司 X 的 2 个 商标 — | 8 个 其 他 商标 
i i 1 
选择 1 个 I 选择 2 个 
open  ()- sann 
1/= [el STRE i2] 7 2(8 — 2) = 28 种 不 同 可 能 性 


N | " 一 
2-28 = 56 个 简单 事件 


注意 , 从 公司 X 中 选择 一 个 商标 有 2 种 方法 ,选择 2 个 其 他 商标 有 28 种 方法 ( 因 
为 选择 的 顺序 是 不 重要 的 , 所 以 利用 组 合法 则 ). 然后 , 利用 乘法 法 则 将 从 公司 X hit 
择 一 个 商标 的 2 种 方法 中 的 一 个 和 选择 其 他 2 个 商标 的 28 种 方法 中 的 一 个 结合 得 到 ， 
事件 A 共 包含 56 个 简单 事件 

事件 中 的 简单 事件 包括 公司 X 有 1 个 或 者 2 个 商标 人 围 的 所 有 简单 事件 . 我 们 
已 经 知道 , 公司 X 恰 有 1 个 商标 人 围 的 简单 事件 的 个 数 为 55 事件 4 中 的 元 素 个 
数 . 公司 X 恰 有 2 个 商标 入 围 的 简单 事件 的 个 数 等 于 从 公司 X 的 2 个 商标 中 选择 2 个 
的 方法 个 数 和 从 其 余 8 个 商标 中 选择 第 3 个 商标 的 方法 个 数 的 乘积 ， 





80 第 3 章 
公司 X 的 2 个 商标 i 8 asad 
l : 
选择 2 个 : 选择 1 个 
2 N : s\ M 
2 = 1] 种 可 能 : | =8 种 不 同 可 能 性 


` 


(1)(8) = 8 个 简单 事件 
那么 选择 1 个 或 者 2 个 公司 X 的 商标 的 简单 事件 个 数 是 : 
(包含 1 个 X 商 标的 个 数 ) + (包含 2 个 X 商 标的 个 数 ) 
即 
56+8=64 
步骤 5 由 于 所 有 简单 事件 是 等 可 能 的 , 因此 ， 


pea = 和 中 简单 事件 的 个 数 - 56 -了 
所 有 简单 事件 的 个 数 120 7 





以 及 
pup) -8 中 简单 事件 的 个 数 648 
所 有 简单 事件 的 个 数 “120 15 
学 习 确 定 在 试验 中 应 用 哪个 计数 法 则 需要 耐心 和 实践 . 如 果 你 想 提高 这 种 技能 , 利用 这 些 法 则 
解答 下 面 的 练习 和 本 章 末 给 出 的 补充 练习 . 


应 用 练习 关于 腿 部 运动 的 阻抗 的 研究 . 回顾 韩国 工程 师 将 电 
3 49 -NRP AIAN. ARTHUR BRE BTS SINI RES E, WEAN Ë 


ili. 在 Journal of Quali in Maintenance Engineering a 将 6 个 电压 电极 附着 于 脚 踩 的 关键 部 位 . 那么 肢 


(2003 年 第 9 35) 里 ,研究 人 员 利 用 层次 分 析 法 帮 饶 上 的 电极 对 可 能 有 多 少 个 ? 

助 ARTHUR 建立 一 个 推荐 的 维护 组 织 . 这 个 过 程 b. 将 电压 电极 附着 于 膝盖 的 关键 部 位 . 那么 膝盖 
要 求 构建 者 在 三 个 不 同 阶段 ( 称 作 层次 ) 从 选项 中 上 的 电极 对 可 能 有 多 少 个 ? 

分 别 选择 1 个 . 在 第 一 个 层次 里 ,构建 者 必须 从 2 ce 确定 将 一 个 电极 附着 于 膝盖 ,一 个 附着 于 脚 中 
个 汽车 部 队 (普通 士兵 或 者 受过 工程 训练 的 士兵 ) 时 , 电极 对 的 可 能 个 数 . 


° 


中 选择 1 个 . 在 第 二 个 层次 里 ， 构建 者 从 3 个 重型 。 3.51 2466334. 佛罗里达 大 学 的 数学 家 利用 
汽车 部 队 ( 挪 威 军队 中 的 部 队 、 来 自 于 供应 者 2 的 分 拆 理论 解决 了 一 个 30 年 的 数学 问题 ，( Explore, 
部 队 , 或 者 共有 部 队 ). 最 后 , 在 第 三 个 层次 里 , 构 2000 年 秋 . ) 在 数学 术语 里 ， 分 拆 是 将 一 个 整数 表 
建 者 从 3 个 维护 车 间 (挪威 军队 、 供 应 者 1 或 供应 。 示 为 正 整数 的 和 (例如 , 数字 3 有 三 个 可 能 的 分 


者 2) 中 选择 1 个 . 拆 : 3,2+1 和 1+1+1. ) 研 究 者 利用 一 个 数 的 “ 彩 
a 当 在 三 个 层次 中 作出 选择 时 , 存在 多 少 种 维护 色 分 拆 "来 解决 这 个 问题 ,其 中 彩色 相应 于 一 副 标 
结构 ? 准 的 52 张 桥牌 中 的 4 种 花色 一 红 桃 、 方 片 、 黑 桃 


b. 研究 人 员 确 定 a 中 只 有 4 个 选项 对 于 ARTHUR 和 梅花 . 考虑 形成 一 个 整数 的 彩色 分 拆 . 
是 可 行 的 . 如 果 随 机 选择 一 个 选项 , 它 是 一 个 可 a. 数字 3 有 和 多少 个 可 能 的 彩色 分 拆 ? (提示 : 一 个 
行 选项 的 概率 是 多 少 ? 分 拆 是 3 单 ; 另 一 个 是 2 多 +14. ) 
3.50 监控 腿 部 运动 的 阻抗. 参看 练习 2.36, IEICE b. 数字 5 有 多 少 个 可 能 的 彩色 分 拆 ? 
Transactions on Information & Systems(2005 4E 1 月) 3.52 全球 气候 变化 的 影响 . 卡 内 基 梅 隆 大 学 的 研究 
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3. 


人 员 调 查 了 全 球 气候 变化 对 美国 经 济 的 影响 ( Enoi- 

ronmental Science & Technology, 1993 年 10 H). 为 

了 评价 学 术 团体 的 观点 , 研究 人 员 设 置 了 某 些 假 

定 情景 . 研究 的 一 部 分 是 由 降低 成 本 和 气候 变化 损 

害 的 不 同 观点 所 确定 的 情景 . 降低 成 本 的 观点 分 为 

“积极 的 " “中 性 的 "或 者 “消极 的 ”. 类 似 地 , 气候 

变化 损害 的 观点 分 为 “积极 的 ”"、“ 中 性 的 ”或 者 “ 消 

极 的 ”. 

a. 确定 不 同情 景 的 可 能 个 数 , 其 中 情景 是 降低 成 
本 观点 和 气候 变化 损害 观点 的 组 合 . 

b. 列 出 a 中 的 情景 . 

c. 在 研究 的 其 他 部 分 ,从 a 的 情景 中 选择 5 个 做 
进一步 的 调查 . 如 果 5 个 情景 都 是 随机 选择 的 ， 
那么 存在 多 少 种 选择 方案 ? 


.53 化 学 催化 剂 研究 . 联合 碳化 物 公司 进 行 过 一 项 


研究 , 识别 单 乙醇 胺 ( MEA ) 转换 成 乙 二 胺 (EDA， 

肥 气 中 的 一 种 商用 物质 ) 时 最 优 催化 剂 的 制备 条 

件 ”. 初始 的 试验 计划 是 筛选 4 Ph B CER, ph. ge 

和 铜 ) 和 4 类 催化 剂 载体 ( 低 酸 度 、 高 酸度 、 多 孔 的 

和 大 的 表面 区 域 ). 

a 这 个 试验 有 多 少 个 可 能 的 金属 - 载体 组 合 ? 

b， 所 有 4 类 催化 剂 载体 都 是 和 一 种 金属 以 随机 顺 
序 进 行 测试 的 . 那么 这 4 类 载体 和 每 种 金属 一 
共有 多 少 种 不 同 的 测试 顺序 ? 

54 脑 电波 研究 . 人 类 能 够 通过 脑 电 波 过 程 与 机 器 

交流 吗 ? 这 个 问题 是 发 表 在 IEEE Engineering in 

Medicine and Biology Magazine ( 1990 年 3 H) 上 研究 

的 主题 . 将 志愿 者 与 计算 机 和 脑 电 图 (EECG ) 监控 器 

接 通 . 每 个 对 象 在 2 个 条 件 ( 睁 眼 和 闭 眼 ) 下 完成 5 

个 任务 . 

a. 确定 试验 条 件 个 数 . 每 个 对 象 在 此 条 件 下 进行 
测试 . 

b. 列 出 a 的 条 件 . 

e. 每 个 对 象 记录 2 个 测量 值 : 一 个 是 在 无 伪 影 
EEG 后 2 s; 一 个 是 在 无 伪 影 EEG 后 0.25 s. 每 
个 对 象 得 到 测量 值 总 个 数 是 多 少 ? 

55 混凝土 建筑 物 评估 . 在 模拟 地 震 荷 载 的 条 件 

下 ,设计 并 测试 一 个 整体 为 钢筋 混凝土 的 建筑 物 

( Journal of Structural Engineering , 1986 年 1 H). iR 





O Hansen, J. L. , ffl Best, D. C. “How to Pick a Winner. 
Biometric Society, 1986 4E 8 H , 艺 加 哥 , IL. 


° 


e 


验 完成 后 , 对 某 些 设计 工程 师 进行 了 一 项 问卷 调 

E, 要求 他 们 评估 三 个 部 分 (抗震 墙 、 柱 和 梁 ) 中 的 

两 个 建筑 参数 (大 小 和 强度 ). 对 每 个 参数 - 部 分 

的 组 合 , 设计 工程 师 从 下 面 三 个 响应 中 选择 一 个 : 

太 强 、 大 致 合适 和 太 弱 . 

a. 在 调查 问卷 中 , 可 能 有 多 少 种 不 同 的 响应 ? 

b. 假定 还 要 求 设 计 工 程 师 选择 全 面 等 级 最 高 的 三 
个 参数 - 部 分 组 合 , 并 将 它们 从 1 ~ 3 BET, 那 
么 有 多 少 种 可 能 的 不 同 排序 ? 

56 报警 信号 码 组 合 . 在 数字 面板 上 , 以 适当 的 顺 

序 正 确 输 入 合适 的 三 位 数 的 数字 代码 来 激活 和 解 

除 安全 警报 系统 . 

a. 如 果 数 字 不 可 以 使 用 2 次 , 计算 可 能 的 代码 组 
合 总 数 . 

b， 如 果 数 字 可 以 重复 使 用 , 计算 可 能 的 代码 组 合 

57 更 换 切 前 工具 . 在 高 容量 机 器 中 心 , 经 常 在 固 

定 的 探索 式 选 择 的 时 间 间 隔 内 更 换 切削 工具 . 这 些 

间隔 一 般 是 不 合 时 家 的 , 即 工具 更 换 得 太 早 或 者 

XH . Journal of Engineering for Industry ( 1993 年 8 

月 ) 刊登 了 一 个 自动 实时 诊断 系统 , 它 是 为 在 最 佳 

的 时 间 蔡 换 钻 孔 机 的 切削 工具 而 设计 的 . 为 了 测试 

系统 , 在 大 范围 的 机 械 加 工 条 件 下 收集 数据 . 试验 

变量 如 下 : 

1. 2 个 工件 材料 ( 钢 和 锻 铁 ). 

2. 2 个 钻 孔 大 小 (0. 125 in 和 0. 25 in). 

3. 6 个 钻 孔 速度 (1250、1800、2500、3000、3750 和 
4000 转 /分 钟 ). 

4. 7 个 进 料 速度 (0. 003 、0. 005 、0. 0065 、 0. 008 、 
0. 009, 0.010. 0.011 英寸 / 转 ). 

a. 有 和 多少 种 不 同 可 能 的 机 械 加 工 条 件 ? 

b. 下 表 描 述 了 研究 中 实际 采用 的 8 个 机 械 加 工 条 
件 . 假定 a 中 机 器 组 合 有 一 个 ( 且 仅 有 一 个 ) 发 
现 系统 中 的 缺陷 . 那么 研究 中 所 进行 的 试验 发 
现 系 统 缺 陷 的 概率 是 多 少 ? 

c. 根据 b, 假定 当 钻 孔 钢 材料 的 销 孔 大 小 为 0.25 in, 
速度 为 2500 转 / 分 钟 时 , 系统 出 现 缺 陷 . 求实 际 
试验 将 发 现 系 统 缺 陷 的 概率 是 多 少 ? 


”发 表 于 Joint Statistical Meetings, American Statistical Association and 
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工作 STA SER 进 料 速度 工具 分 配 4 个 特 遗 部 队 成 员 , 那么 可 能 有 多 少 种 不 
试验 材料 (in) ”〈( 转 /分 钟 ) (英寸 / 转 ) 同 的 分 配方 案 ? 

1 锻 铁 0.25 1250 0.11 (O 选 做 的 应 用 练习 

+ FA OBO 180 OO g&6) Sen gs, A MFS JUR 
3 钢 0.25 3750 0. 003 率 是 多 少 ? 

4 钢 0.25 2 500 0. 003 3.61 br 21 点 . 21 点 是 赌博 者 非常 喜欢 的 一 个 游 
5 i 025 2500 — 0.008 R, HUESCHUE E AXES ERE NO 52 张 纸牌 来 
6 钢 0.125 4000 0.0065 Bi. 每 张 纸牌 指派 一 个 数字 ， 从 2 ~ 10 的 数字 牌 按 
7 ý 0.125 4000 0.009 牌 面 上 的 值 指派 数值 . A, KR 7 的 值 为 7 
Š 8 0.125 3000 0.010 一 张 红 桃 3 的 值 为 3. AIR CK, Q 和 了 ) 都 定 为 


10, A 可 能 指派 为 1 或 者 11， 由 持 牌 的 玩家 来 决 
AE. 在 游戏 开始 时 , 发 给 对 手 2 张 牌 ,发 给 庄家 2 
张 牌 . 获得 一 张 A 和 任何 一 张 点 数 为 10 的 牌 就 叫 
做 21 点 . 在 许多 娱乐 场所 , 如 果 庄家 得 到 了 21 点 ， 
他 或 她 将 自动 获胜 . 

a 庄家 得 到 21 点 的 概率 是 多 少 ? 

b， 游 戏 者 得 到 21 点 获胜 的 概率 是 多 少 ? 


3.58 选择 垫圈 . 假定 需要 在 一 个 核 动力 装备 里 更 换 
5 个 垫圈 . 如 果 你 有 一 个 盒子 , 里面 有 20 个 垫圈 ， 
从 中 选择 5 个 , 那么 可 能 有 多 少 不 同 的 选择 ， 即 从 
20 个 垫圈 中 选择 5 个 , 可 能 有 多 少 个 不 同 的 样本 ? 

3.59 FAA 特 遗 部 队 , 为 了 评估 依赖 于 计算 机 的 4 
种 工具 的 交通 控制 系统 , 联邦 航空 管理 局 ( FAA) 
成 立 了 一 支 16 人 的 特 遗 部 队 . 如 果 FAA 想 为 每 种 


3.9 概率 和 统计 的 示例 


在 前 面 几 节 中 , 我 们 介绍 了 一 些 新 的 概念 ， 大 家 可 能 觉得 学 习 概 率 比较 难 . 因此 , 在 概率 和 统 
计 之 间 建 立 清 晰 的 连接 是 非常 重要 的 ， 在 下 面 的 章节 中 我 们 将 做 这 件 事 . 虽然 贝 叶 斯 法 则 论证 了 
概率 可 以 用 于 统计 推断 ， 但 是 传统 的 统计 推断 方法 以 稍微 不 同 的 方法 利用 概率 . 本 节 将 给 出 这 种 
传统 的 统计 推断 方法 的 一 个 简短 例子 ， 以 使 读者 理解 为 什么 概率 知识 在 统计 学 的 研究 中 如 此 
重要 . 
假定 一 家 生产 螺栓 的 公司 正在 研究 下 面 的 假设 : 他 们 的 新 型 化 学 柱头 螺栓 比 传统 机 械 柱头 螺栓 
有 更 强 的 保持 能 力 和 更 大 的 负载 能 力 . 为 了 检验 这 个 假设 ， 从 一 天 的 产品 中 选择 3 个 新 型 化 学 柱头 螺 
栓 并 进行 一 项 保持 能 力 测试 . 将 这 3 个 长 为 1/2 in 的 螺栓 钻 孔 拧 入 由 石头 和 混凝土 做 成 的 4000 Ibin? 
的 混凝土 路 面 中 , 并 且 记 录 它 们 的 张力 负荷 强度 (lb). 从 许多 先前 的 机 械 柱头 螺栓 的 保持 能 力 测 试 
中 知道 , 大 约 16% 的 机 械 柱头 螺栓 有 超过 12 000 磅 的 张力 强度 . 假定 测试 的 所 有 3 个 化 学 柱头 螺栓 
有 超过 12 000 磅 的 张力 强度 . 研究 员 将 对 这 个 公司 得 出 什么 结论 ? 
为 了 回答 这 些 问题 , 定义 事件 
Ar: | 化 学 柱头 螺栓 1 有 超过 12 000 lb 的 张力 强度 ; 
A»: | 化 学 柱头 螺栓 2 有 超过 12 000 Db 的 张力 强度 | 
As: {化 学 柱头 螺栓 3 有 超过 12 000 Ib 的 张力 强度 } 
我 们 想 求 所 有 3 个 测试 的 螺栓 的 张力 强度 都 超过 12 000 Tb 的 概率 , B P(A QA NA). 
由 于 螺栓 是 从 大 量 产品 中 偶然 选取 的 , 假设 事件 4 ， A, 和 43 相互 独立 似乎 是 合理 的 . HU 
P(42141) = P(A3) 
换言之 , 第 一 个 螺栓 的 张力 强度 超过 12 000 Ib 并 不 影响 第 二 个 螺栓 的 张力 强度 超过 12 000 Ib 的 概 


Ë + 
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率 . 有 了 独立 性 的 假定 , 我 们 可 以 通过 将 单个 概率 相 乘 来 计算 交 的 概率 ， 
P(A; nA, 43) z P(A4,) P(A;) P(A,) 

如 果 新 型 化 学 柱头 螺栓 不 比 机 械 柱头 螺栓 强 或 者 弱 , 即 如 果 化 学 柱头 螺 检 张力 强度 的 相对 频率 
分 布 和 机 械 柱 头 螺栓 的 张力 强度 的 相对 频率 分 布 没有 什么 差别 ,我们 期 望 大 约 1696 的 新 型 螺栓 的 张 
力 强 度 超过 12 000 Ib. 因此 , 对 于 所 有 3 个 螺栓 ,P(4;) 的 估计 值 是 0. 16, B 

P(A NA, 145) = (0.16) (0. 16) (0. 16) =0. 004096 
因此 , 公司 的 研究 人 员 观 测 到 所 有 3 个 螺栓 的 张力 负载 能 力 都 超过 12 000 1b 的 概率 仅仅 大 约 
0. 004. 如 果 这 个 事件 发 生 , 那么 研究 人 员 可 以 得 出 ， 这 是 化 学 柱头 螺栓 比 机 械 柱 头 螺栓 具有 更 强 的 
张力 负载 能 力 的 理论 凭证 , 因为 如 果 张 力 强度 的 分 布 是 相同 的 , Ë Z 太 可 能 发 生 的 . 这 种 结论 是 
稀有 事件 对 统计 推断 的 一 个 应 用 . 从 中 可 以 看 到 概率 的 基本 原则 起 着 重要 的 作用 . 


(9) 应 用 练习 


3. 


3. 


62 恒星 的 亮度 . Sky & Telescope(1993 年 5 月 ) 刊 
登 了 以 色 列 特拉维夫 大 学 的 Noah Brosch 发 现 了 室 
女 座 中 新 的 星 群 .“5 个 恒星 (所 有 都 呈现 超过 第 13 
个 量 级 的 亮度 ) 组 成 了 一 个 边 长 仅 有 42 s 长 的 钻石 
状 区 域 . 5 个 有 相近 亮度 的 恒星 偶然 如 此 紧密 的 概 
率 是 很 小 的 , 且 Brosch 认为 这 种 销 石 恒星 …… 是 
自然 地 关联 的 . ”假定 文章 中 提 及 的 “概率 "是 小 的 
(如 小 于 0.01), 你 同意 这 位 天 文学 家 所 作 的 推 
断 吗 ? 


.63 有 缺陷 的 CD. 经 验 表 明 , 生产 可 写 人 CD 的 厂 


商 平 均 每 100 张 CD PAA 1 张 有 缺陷 . 假定 在 随 
后 生产 的 4 张 CD 中 至 少 1 张 有 缺陷 . 你 对 声明 的 
0.01 缺陷 率 有 什么 推断 ? 说 明 原 因 . 

64 五 油 租 借 权 . 自从 1961 年 以 来 , 可 能 含有 石 
油 的 小 抉 土地 都 以 彩票 的 形式 租借 , 中奖 者 将 得 
到 为 期 10 年 的 租借 权 ( 以 每 年 每 英亩 1 美元 租 
借 ). 21 岁 或 年 龄 更 大 的 美国 公民 向 土地 管理 局 支 
f] 10 美元 的 申请 费 后 就 有 资格 参与 一 次 彩票 抽奖 
(参看 The Federal Oil & Gas Leasing System ， 联 邦 资 
源 注 册 处 ，1993 4E). 但 是 在 1980 年 的 一 些 月 份 
H, 怀疑 一 个 玩家 在 1 个 月 内 利用 彩票 赢得 了 3 
REH. 3 张 彩票 的 登记 号 分 别 为 1836, 1365 和 


3.10 ”随机 抽样 
在 统计 推断 中 ,怎样 从 总 体 中 选取 样本 是 至 关 重要 的 ,因为 观测 到 的 样本 概率 将 用 于 推断 抽 





Ce 


495. 一 个 内 务 部 的 审计 员 声称 “联邦 工作 人 员 做 了 
一 件 非 常 精 糕 的 事 ， 即 在 出 结果 前 抖动 了 圆 盘 . n 
根据 你 对 概率 和 稀有 事件 的 了 解 , 你 会 作出 和 那 
位 审计 员 一 样 的 推断 吗 ? 


.65 ”高射炮 瞄准 误差 . 在 第 二 次 世界 大 战 开始 时 ， 


一 群英 国 工程 师 和 统计 学 家 聚集 在 伦敦 调查 防空 
武器 的 毁坏 性 问题 2. 这 个 研究 团队 的 主要 目的 之 
一 是 评 佑 单 发 炮弹 摧毁 (或 击 伤 ) 所 瞄准 的 飞行 器 
的 概率 . 虽然 在 那 时 已 有 大 量 地 对 地 炮弹 的 数据 ， 
但 是 关于 高 射 炮 精度 的 有 用 信息 却 很 少 . 因此 ， 
1940 年 进行 了 一 系列 试验 , 炮 手 向 自 由 飞行 (无 人 
PO 的 飞机 开火 . 但 是 在 同年 的 下 半年 , 当 德国 飞 
机 开始 又 炸 英格兰 时 ， 研究 者 发 现在 战场 压力 下 ， 
高 射 炮 的 瞄准 误差 要 比 根据 试验 得 到 的 估计 值 大 很 
多 . 令 p 表示 高 射 炮弹 在 目标 半径 为 30 的 范围 内 
击 中 的 概率 . 假定 在 模拟 条 件 下 , p =0. 45. 
a. 在 遭受 到 德国 飞机 的 实际 打击 下 , 假定 3 门 高 
射 炮 开火 且 所 有 3 门 高 射 炮 都 因 大 于 30 ñ 而 没 
有 击 中 目标 . 在 战场 条 件 下 , p 不 是 0. 45 的 结论 
是 否 合理 ? 
b. 假定 观测 到 10 次 连续 射击 ， 由 于 距离 超过 
30 ft, 所 有 高 射 炮 都 没有 击 中 它们 的 目标 , 回答 
a 的 问题 . 


Q Pearson, E. S. “统计 学 和 概率 在 二 次 世界 大 战 中 防空 火力 问题 上 的 应 用 . "网 Statistics; A Guide to the Unknown, 第 2 


期 , 旧金山 : Holden-Day, 1978, p. 474 — 482. 
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样 总 体 的 特征 . 为 了 说 明 这 一 点 , 假定 从 一 副 52 张 牌 中 抽取 4 张 且 所 有 4 张 都 是 A. 你 是 否 会 得 

E, 你 的 牌 是 一 副 普 通 的 只 包含 4 A 的 桥牌 , 或 者 这 副 牌 不 止 4 张 A? 这 取决 于 怎样 抽取 牌 . 
如 果 4 张 A 总 是 放 在 一 副 标 准 桥牌 的 最 上 面 , 那么 抽 4 E A 就 很 常见 , 这 是 显然 的 . 另 一 方面 ， 
如 果 牌 被 彻底 搞 混 了 , 那么 在 一 个 4 张 牌 的 样本 中 抽 到 4 张 A 是 非常 不 可 能 的 . 显然 ,重要 的 是 
为 了 利用 抽取 的 4 张 牌 的 观测 样本 对 总 体 (一 副 52 张 牌 ) 进行 推断 , 你 需要 知道 样本 是 怎样 从 这 
副 牌 中 选取 的 . 

前 面 的 例子 和 练习 隐 含 了 一 种 最 简单 旦 最 常用 的 抽样 过 程 . 它 产生 的 样本 称 为 贿 机 样本 . 

定义 3. 11 如果 以 这 样 一 种 方法 从 总 体 中 选取 nn 个 元 素 , 使 得 总 体 中 的 每 个 n 个 元 素 的 集合 
都 被 以 等 概率 选择 ,那么 这 n 个 元 素 称 为 一 个 随机 样本 >. 

如 果 总 体 不 是 很 大 , 县 元素 可 以 在 纸张 、 扑 克 牌 等 上 编号 , 那么 你 可 以 动手 将 这 些 纸 或 牌 
混合 并 从 总 体 中 抽出 n 个 元 素 . 被 选 的 牌 面 显 示 的 数字 表示 包含 在 样本 中 的 总 体 元 素 . 由 于 要 
达到 充分 混合 通常 是 困难 的 , 因此 这 个 过 程 仅 提供 了 随机 抽样 的 一 个 近似 . 许多 科学 家 和 工程 
师 利 用 随机 数 发 生 器 自动 生成 随机 样本 . 随机 数 发 生 器 提供 表格 形式 , 它们 被 内 置 于 许多 统计 
软件 包 . 

EEEN 假定 从 100 根 玻璃 纤维 中 随机 选择 5 根 进行 强度 测试 . 

a. 可 以 选择 多 少 个 不 同 的 样本 ? 

b. 利用 随机 数 发 生 器 选择 随机 样本 . 

解 

a. 由 于 我 们 想 从 N = 100 个 对 象 (玻璃 纤维 ) 中 选择 n=5 根 , 应 用 3.8 节 的 组 合法 则 : 


N 100 ! 
)-Í )= 100! _100 - 99 . 98 + xl 78-75 287 520 





5] 5195| 5-4-3. 
因此 , 共有 超过 7 500 万 种 方法 从 100 根 玻 璃 纤维 中 和 5 pM 

b. 为 了 保证 每 个 可 能 的 样本 以 相等 机 会 被 选中 , 和 随机 抽样 的 要 求 一 样 , 我 们 可 以 利用 附录 B 
中 表 B. 1 的 随机 数 表 . 随机 数 表 是 利用 一 种 使 每 个 数 以 (近似 ) 等 概率 出 现 的 方法 构造 的 . m EL, 在 
某 个 位 置 上 任何 数 的 发 生 与 出 现在 表 中 的 任何 其 他 数 是 独立 的 . 为 了 利用 随机 数 表 , 将 总 体 中 的 N 
个 元 素 记 为 从 1 ~ N 的 数 . 然后 在 表 B. 1 中 选择 一 个 开始 的 数 . 从 这 个 数 出 发 沿 着 行 或 者 列 从 表 中 抽 
出 并 记录 nn 个 数 . 

首先 将 玻璃 纤维 从 1 ~ 100 标号 . 然后 翻 到 表 B. 1 的 某 页 , 例如 第 1 页 ( 表 3.7 给 出 了 表 B.1 第 1 
页 的 一 部 分 ). ME, 任意 选择 一 个 开始 的 数 , 例如 , 出 现在 第 13 行 第 1 列 的 随机 数 一 一 09429. SUR] 
用 前 三 位 数 得 到 随机 数 94. 我 们 沿 着 列 的 向 下 方向 进行 如 下 过 程 : 观察 随机 数 的 前 三 位 数字 且 跳 过 
任何 大 于 N=100 的 数字 , 直到 得 到 5 个 随机 数 . 这 种 方法 得 到 的 随机 数 94, 103 (BESE) , 71, 510( 跳 
ib), 23, 10, 521( 跳 过 ) 和 70( 表 3.7 着 重 显示 了 这 些 数 ). 这 样 , 我 们 的 样本 就 包括 编号 为 94, 71， 
23, 10 和 70 的 玻璃 纤维 . 


n 





O 严格 地 说 , 这 是 简单 随机 样本 . 存在 许多 不 同类 型 的 随机 样本 . 例如 , 将 总 体 分 组 ( 层 ) 晶 从 每 组 中 选择 元 素 的 随机 样 
本 就 得 到 分 层 随机 样本 ; 整 群 样本 是 从 总 体 中 随机 选择 元 素 的 组 (或 群 ) 并 抽取 每 个 群 中 的 所 有 元 素 ; 从 总 体 中 系统 
地 选择 每 第 大 个 元 素 得 到 一 个 系统 样本 . 由 于 简单 随机 样本 是 最 常见 的 ， 四 此 我 们 仅 讨论 这 种 | 情况 . 
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È: 只 用 每 个 随机 数 中 必需 的 位 数 确定 包含 在 样本 中 的 元 素 . 如 果 在 根据 表 记 录 n AKHIR 
中 ,你 选择 了 一 个 已 经 被 选 到 的 数 ， 只 要 竺 弃 重 复 的 数 ， 并 以 序列 末尾 一 个 数 蔡 代 它 . At, 为 了 获 
得 一 个 包含 风 个 不 同 数 字 的 样本 ,从 表 中 记录 的 数 可 能 超过 nn 个 . 





附录 B 中 的 表 B. 1 只 是 随机 数 发 生 器 表 3.7 表 B.1 的 一 部 分 
的 一 个 例子 . 对 于 许多 需要 大 量 随 机 样本 列 1 2 3 4 5 
M M = > y ` - f 
pa 可 以 用 计算 机 生成 随机 1 10480 15011 01536 02011 81647 
样本 . 本 书 涉及 的 统计 软件 包 都 有 易于 使 2 22368 46573 25595 85393 30995 
用 的 随机 数 发 生 器 . 3 24130 48360 — 22527 97265 76393 
例如 , 假定 我 们 需要 从 100 000 个 玻璃 4 42167 93093 06243 61680 07856 
纤维 中 抽取 一 个 n=25 的 随机 样本 . 这 里 5 37570 39975 81837 16656 06121 
可 以 用 SAS 随机 数 发 生 器 . 图 3. 14 给 出 了 6 77921 06907 11008 42751 27756 
7 99562 72905 56420 69994 98872 
IRAS) 2 , 4 
E e E ua: : pis ( i 8 96301 91977 05463 07972 18876 
100 000 个 元 素 的 总 体 中 ). 有 这 些 识别 标 9 89579 14342 63661 10281 17453 


号 的 玻璃 纤维 应 包含 在 随机 样本 中 . 10 85475 — 36857 53342 — 53988 — 53060 

我 们 将 要 学 习 的 随机 选取 和 随机 化 的 i 28918 — 69578 88231 — 33276 70997 
概念 是 进行 良好 研究 的 关键 之 一 . 下 面 最 12 63553 40961 48235 03427 49626 
后 一 个 例子 阐述 了 怎样 随机 化 的 基本 13 09429 - 93969 52636 92737 — 88974 


应 用 14 10365 . 61129 — 87529 — 85689 — 48237 

15 07119 - 97336 71048 08178 77233 
乔治 亚 理工 学 院 的 工程 师 进行 16 51085 ^ 12765 51821 51259 77452 
了 一 项 试验 , 测量 从 事 有 认 知 要 求 工 作 17 02368 . 21382 — 52404 60268 89368 
(如 空中 交通 管制 员 或 雷达 / 声 纳 操作 员 ) 18 01011 — 54092 — 33362 94904 3127 
的 人 员 执 行 一 个 视觉 搜索 任务 时 的 反应 19 52162 — 53916 46369 58586 23216 

20 | 07056. 97628 — 33787 09998 — 42698 


ERI. (Human Factors, 1993 To A. ; 将 21 48663 91245 85828 14346 — 09172 
志愿 者 随机 地 分 成 两 组 . 一 组 训练 用 “ 连 22 54164 58492 22421 74103 47070 
续 一 致 "方法 (方法 A) 搜 索 , 另外 一 组 训 23 32639 — 32363 — 05597 24200 13363 
练 则 用 “调整 一 致 "方法 (方法 B) 搜索 ， 24 29334 — 27001 87637 87308 — 58731 
目的 是 比较 两 组 的 反应 时 间 . 假定 这 项 研 25 02488 — 33062 — 28834 07351 19731 
究 有 20 名 志愿 者 . 利用 随机 数 发 生 器 随 

机 地 将 志愿 者 的 一 半分 配给 方法 A， 一 半分 配给 方法 B. 

解 本质 上 , 我 们 想 要 从 20 名 志愿 者 中 选择 10 名 的 随机 样本 . 首先 选 出 的 10 名 分 配 到 方法 A 
的 组 ; 剩 下 的 10 名 分 配 到 方法 B 的 组 . (另外 ， 我 们 可 以 逐一 地 随机 分 配 每 个 志愿 者 到 方法 A 或 者 
B. 但 是 , 这 将 不 能 保证 每 个 组 中 恰好 有 10 名 志愿 者 . ) 

利用 MINITAB 的 随机 样本 程序 , 图 3. 15 给 出 了 产生 的 输出 . 将 志愿 者 从 1 ~ 20 编号 ， 我 们 看 到 
志愿 者 8, 13, 9, 19, 16, 1, 12, 15, 18 和 14 分 配 到 按照 方法 A 训练 的 组 . 剩 下 的 志愿 者 分 配 到 按照 
方法 B 训练 的 组 . 
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Ei Random sample of lot Table 





3.14 SAS 生成 的 25 个 玻璃 纤维 片 随机 样本 


应 用 练习 

3.66 地 下 井 水 的 污染 . 参看 练习 3.5, Environmental 
Science & Technology( 2005 年 1 月 ) 关 于 美国 新 罕 布 
什 尔 州 223 口 并 中 甲 基板 丁 基 醚 (MTBE) 污 染 的 研 
F, 井 的 数据 保存 在 文件 MTBE 中 . 假定 从 这 些 并 
中 选择 5 口 作为 样本 , 并 对 每 口 并 中 的 水 进行 彻底 
的 分 析 . 利用 计算 机 或 表 B. 1 从 223 口 井 中 选择 容 
量 为 5 的 随机 样本 . 列 出 你 的 样本 中 所 包含 的 井 . 

3.67 地震 余震 的 震级 参看 练习 2. 13 , 关于 洛杉矶 
地 区 地 震 余震 的 美国 地 理 调查 . 2 929 个 余震 的 震 
级 数据 保存 在 EARTHQUAKE 文件 中 . 利用 计算 机 
或 表 B. 1 从 EARTHQUAKE 中 选择 包含 30 个 余震 
的 随机 样本 . 指出 你 的 样本 中 的 余震 . 

3. 68 每 周一 氧化 碳 数 据 . 参看 练习 1.7, 世界 温室 
气体 数据 中 心 在 阿拉 斯 加 的 科 尔 德 湾 气 象 台 收集 
的 每 周一 氧化 碳 气 体 测 量 值 的 数据 . 2000 年 至 
2002 年 的 590 周 的 数据 保存 在 COGAS 文件 中 . 利 
用 计算 机 或 者 表 B. 1 从 COGAS 文件 中 选择 包含 15 
周 的 随机 样本 . 指出 你 的 样本 中 的 那些 星期 . 

3.69 肺癌 的 CT 扫描 . 参看 练习 1.12, 南 佛罗里达 
大 学 对 吸烟 者 进行 临床 试验 来 比较 在 发 现 肺癌 方 
面 CT 扫描 与 X 射线 的 效力 . (Today's Tomorrows, 
2002 年 秋 . ) 回顾 为 每 位 吸烟 者 随机 地 分 配 2 个 扫 
描 方法 中 的 一 个 (CT 或 者 胸部 X 射线 ) ， 且 确定 扫 
描 方 法 首次 发 现 肿瘤 的 年 龄 ( 岁 ). 研究 目的 之 一 
是 比较 两 种 扫描 方法 首次 发 现 瘤 症 时 的 平均 年 龄 . 
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图 3.15 MINITAB 的 志愿 者 随机 分 配 工 作 表 


假定 试验 中 有 120 位 吸烟 者 , 利用 随机 数 发 生 器 为 

两 种 扫描 方法 中 的 每 种 随机 分 配 60 位 吸烟 者 . 

70 ”抽样 枪支 弹药 . 武器 制造 商 生 产 了 一 批 600 颗 

枪弹 . 假定 制造 商 想 从 这 批 600 颗 子弹 中 抽取 3 颗 

的 样本 来 检查 . 

a. 利用 组 合 数学 计算 不 同样 本 的 个 数 . 

b. 如果 采用 随机 抽样 方法 ,任意 某 个 样本 被 选中 
的 概率 是 多 少 ? 

c. 给 出 怎样 利用 表 B. 1 从 600 颗 子 弹 中 选择 容量 
为 3 的 随机 样本 . 执行 抽样 程序 20 次 . 是 否 任 
意 2 个 样本 含有 相同 的 3 颗 子弹 ? 已 知 b 的 答 
案 , 你 期 望 重 复 抽样 吗 ? 

d. 利用 计算 机 从 600 颗 子弹 中 生成 容量 为 3 的 随 
机 样本 . 


. 71 选择 考古 挖掘 地 点 . 考古 学 家 计划 在 一 个 他 们 


认为 几 千 年 前 就 有 人 居住 的 地 点 进行 试验 挖掘， 
这 个 地 方 大 约 长 10 000 m, 宽 5 000 m. 他 们 首先 在 
这 个 区 域 划 边 长 为 100 m 的 正方 形 格子 , 这 样 一 共 
产生 了 100 x50 =5 000 个 交叉 点 (不 计 外 部 边界 的 
点 ). 计划 随机 抽取 50 个 交叉 点 作为 样本 , 并 在 抽 
样 的 交叉 点 上 挖掘 . 解释 怎样 利用 随机 数 发 生 器 得 
到 包含 50 个 交叉 点 的 随机 样本 . 至 少 给 出 2 个 计 
划 : 一 个 在 选择 之 前 对 交叉 点 从 1 ~ 5 000 进行 编 
号 ; 另 一 个 (从 总 共 100 行 50 列 中 ) 选择 每 个 抽样 
交叉 点 的 行 和 列 . 


概 率 87 








快速 回顾 
重要 公式 
一 一 一 -一 LLL 
P(A) +P(A°) =1 补 法 则 
P(AU B) =P(4) +P(B) - P(AnB) 概率 加 法 法 则 
P(AnB) =0 ERME 
P(AUB) =P(A) +P(B) 互 斥 事件 的 概率 加 法 法 则 
P(AIB) OD 条 件 概率 
P(4nB) =P(A)P(BIA) = P(B)P(41B) 概率 乘法 法 则 
P(AIB) =P(A) 独立 事件 
P(AnB) =P(A)P(B) 独立 事件 的 概率 乘法 法 则 
P(A;)P(EIA,) 
P(A; IE) = 


P(A, )P(EIA,) * P(A,) P(EIA,) Te * P(A,)PCEIA,) “ 贝 叶 斯 法 则 
CO 


E: 关于 计数 法 则 的 汇总 , 见 3.8 节 . 





符号 汇集 
CC 
符 = É 法 ¿à B 
s 样本 空间 
S: 11, 2, 3, 4, 5| 样本 空间 中 样本 点 1, 2, 3, 4, 5 的 集合 
A: 11,2! 事件 4 中 样本 点 1, 2 的 集合 
P(A) . A 的 概率 事件 4 发 生 的 概率 
4UB AB 的 并 | 事件 4 和 8 的 并 (或 者 4 或 者 8 或 者 一 者 都 发 生 ) 
ANB AB 的 交 事件 4 和 B 的 交 (4A 和 8B RRE) 
A° A 的 补 事件 A 的 补 (4 不 发 生 事件 ) 
P(AIB) ELI B IN. 4 的 概率 已 知事 件 B 发 生 时 事件 4 发 生 的 条 件 概率 
(2) NX n 从 六 个 元 素 中 一 次 取 个 的 组 合 数 
N! N 的 阶乘 N(N - D) (N -2)--- (2)(1) 
一 一 一 一 LLL 
本 章 总 结 提 示 


。 上 个 样本 点 的 概率 法 则 ; 
(1) 0<P(Si) <1 和 (2) Y P(S) = 1 

。 如 果 4=151, S3, S4}, IA PCA) =P(S1) + PCS) +P(S,). 

”从 个 元 素 中 选取 容量 为 n 的 样本 的 个 数 为 ( "|. 

° 并: (4U8B) 表 示 或 者 4 或 者 8 或 者 二 者 都 发 生 . 

。 交 : (4mB) 表 示 4 和 8 都 发 生 

。 补 : AC 是 所 有 不 在 4 中 的 样本 点 . 

° 条件: (418) 是 在 已 知 B 发 生 的 条 件 下 , 事件 4 发 生 . 

独立 : B 的 发 生 不 改变 4 发 生 的 概率 . 

随机 样本 : 所 有 可 能 的 样本 有 相等 的 选中 概率 . 
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3.72 签约 道路 合同 . 州 运输 部 (DOT) 最 近 宣 布 5 个 





3.74 判断 质量 . 质量 检查 员 的 执行 情况 影响 着 商品 
的 质量 和 产品 的 成 本 . 假定 通过 检查 的 产品 满足 质 


投标 者 在 签约 2 份 道路 建设 合同 中 得 到 了 同等 考 

B, 并 且 事 实 上 , 2 份 合同 的 签约 者 是 从 S 个 投标 

者 中 随机 选取 的 . 投标 者 中 3 个 是 大 型 建设 综合 公 

司 , 2 个 是 小 型 专业 承包 人 . 假定 2 份 合同 都 签 给 

大 型 建设 综合 公司 . 

a 如 果 事 实 上 ，DOT 的 声明 是 正确 的 , 那么 这 个 
事件 发 生 的 概率 是 多 少 ? 

b. a 中 计算 的 概率 是 否 与 DOT 声称 选择 是 随机 的 
不 一 致 ? 

.73 专家 系统 的 知识 库 . YES/MVS( Yorktown 专家 
系统 /MYVS 经 理 ) 是 为 了 专家 主动 控制 计算 机 系统 ， 
且 给 计算 机 操作 员 提 供 建议 而 设计 的 专家 系统 . 
YESZMVS 设计 为 由 548 条 规则 设计 组 成 的 知识 
BE, 这 些 规 则 对 来 自 计算 机 操作 员 的 报 文 或 查询 
作出 反应 . 下 表 给 出 了 分 配给 操作 员 行 为 的 不 同 子 
领域 的 规则 个 数 . YESZMVS 知识 库 里 的 规则 定期 
测试 , 如 果 有 必要 , 还 要 进行 调整 . 假定 随机 选择 
一 条 待 测试 的 规则 且 都 注 明 它 的 类 型 (操作 员 的 行 
为 /查询 ). 





操作 员 的 行为 /查询 规则 个 数 
批 处 理 139 
JES 排队 空间 104 
C - C 链接 68 
硬件 误差 87 
SMF 管理 器 25 
静止 和 IPL 52 
性 能 41 
背景 控制 器 32 
总 计 548 


资料 来 源 : Ennis, R. L., et al. , “A continuous real-time 
expert system for computer operations. ” JBM Journal of Re- 
search and. Development, Vol. 30, No. 1, Jan. 1986, p. 19. 
Copyright 1986 by International Business Machines Corpora- 


tion; reprinted with permission. 


a. 列 出 这 个 试验 的 简单 事件 . 

b. 基于 表 中 的 信息 指派 简单 事件 的 概率 . 

c. 规则 是 C - C 链接 或 者 硬件 误差 规则 的 概率 是 
多 少 ? 

d. 规则 不 是 一 个 性 能 规则 的 概率 是 多 少 ? 


量 标准 ; 未 通过 检查 的 产品 可 能 重 做 、 丢 弃 或 者 重 
新 检查 . 威 斯 丁 豪 斯 电气 公司 的 质量 工程 师 将 每 个 
检查 员 对 153 个 焊接 点 集合 的 分 类 与 专家 组 一 至 
同意 的 评估 进行 比较 ,以 此 评估 检查 员 在 判断 焊 
接点 质量 的 执行 情况 . 一 个 检查 员 的 结果 列 在 下 
表 中 . 











检查 员 的 判断 
委员 会 的 判断 
焊 点 接收 焊 点 拒 收 
焊 点 接收 101 10 
焊 点 拒 收 23 19 


资料 来 源 ; Meagher, J. J. , and Scazzero, J. A. " Measuring 
inspector variability. "39:h Annual Quality Congress Transac- 
tions, May 1985, pp. 75-81. American Society for Quality 


Control. 


从 153 个 焊接 点 中 随机 选择 一 个 . 

a 检查 员 判 断 焊 接点 接收 的 概率 是 多 少 ? 委员 会 
判断 焊接 点 接收 的 概率 呢 ? 

b， 检 查 员 和 委员 会 都 判断 焊接 点 接收 的 概率 是 多 
少 ? 都 不 认为 焊接 点 接收 的 概率 呢 ? 

c. 检查 员 和 委员 会 意见 不 一 致 的 概率 是 多 少 ? 一 
致 的 概率 呢 ? 


75 物种 热 区 . 生物 学 家 将 “ 热 区 "定义 为 一 个 物 


种 丰富 的 地 理 区 域 (10 km’). Nature( 1993 年 9 月 ) 
刊登 了 一 项 关于 某 些 稀有 英国 物种 , 包括 蝴蝶 bs 
晓 和 饲养 鸟 类 的 热 区 的 研究 . 下 表 给 出 了 某 个 物种 
在 热 区 发 现 的 比例 , 例如 , 左下 角 的 值 0. 70 表示 
所 有 英国 鸟 类 中 有 70% 栖 居 在 蝴蝶 热 区 , (Gè: 物 
种 热 区 可 能 有 重复 的 部 分 . ) 








发 现 的 比例 
蝴蝶 热 区 MER 鸟 类 热 区 
蝴蝶 0.91 0. 91 1.00 
L Ld 0.82 0.92 0.92 
528 0.70 0.73 0.87 


资料 来 源 : Prendergast, J. R. ，et al. “ Rare species, the co- 
incidence of diversity hotspots and conservation strategies. " 
Nature, Vol. 365, No. 6444, Sept. 23, 1993, p. 337 ( € 
2c). 


a. BSEC ARS TEB5 EE 3k DX EREL 
b. 蝴蝶 类 栖 居 在 鸟 类 热 区 的 概率 是 多 少 ? 
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c. 解释 为 什么 所 有 蝴蝶 热 区 也 是 鸟 类 热 区 ， 

76 ATV 45 € €. Journal of Risk and Uncertainty 
(1992 年 5 月 ) 刊 登 了 一 篇 文章 ,， 它 调查 了 全 地 形 
车 (ATV) 骑手 的 受伤 率 和 各 种 因素 的 关系 . 所 研究 
的 因素 中 一 个 比较 有 趣 的 因素 是 骑手 的 年 龄 ,发 
现 它 与 受伤 率 有 很 大 的 关系 . 这 篇 文章 表示 , 在 安 
全 警报 程序 前 , 14% 的 ATV 骑手 的 年 龄 低 于 12; 
另外 13% 的 年 龄 在 12 ~ 15 之 间 , # 48% 的 年 龄 低 
F25. 假定 在 安装 安全 警报 程序 前 ,随机 选择 一 名 
ATV 骑手 . 

a. 求 ATV 骑手 是 15 岁 或 更 小 的 概率 . 

b. R ATV 骑手 是 25 岁 或 更 大 的 概率 . 


c. 已 知 ATV 骑手 的 年 龄 低 于 25, 这 个 骑手 的 年 龄 


低 于 12 岁 的 概率 是 多 少 ? 

d. 年龄 小 于 25 和 年 龄 小 于 12 这 两 个 事件 是 互 斥 
的 吗 ? 为 什么 ? 

e. 年 龄 小 于 25 和 年 龄 小 于 12 这 两 个 事件 是 独立 
的 吗 ? 为 什么 ? 


.77 测试 持续 释放 的 药片 . 约翰 公司 的 研究 人 员 开 


发 了 一 种 持续 释放 的 药片 作为 处 方药 . 为 了 确定 这 
种 药片 的 效力 , 进行 如 下 试验 : 从 每 批 30 个 产品 
中 随机 选取 6 个 药片 , 将 每 个 药片 放 人 水 中 且 分 别 
在 2, 4, 6, 8, 10, 12, 16 和 20 小 时 时 测量 溶解 的 
百分数 ”. 

a. 求 试验 中 记录 的 测量 值 (溶解 的 百分比 ) 的 
b. 对 每 一 批 , 将 每 个 时 间 段 的 测量 值 进行 平均 . 可 

以 得 到 多 少 个 平均 值 ? 


-78 镁 铁 的 拉力 强度 . 所 进行 的 一 项 研究 是 检查 单 


向 凝固 的 锭 铁 中 , 等 轴 纹 理 的 成 本 结构 和 机 械 性 
质 之 间 的 关系 (Metallurgical Transactions, 1986 年 5 
月 ). 将 含有 铜 合金 成 分 的 锭 铁 从 横向 或 纵向 浇注 
人 3 个 铸造 模型 ( 简 形 、 混 合 或 者 等 轴 ) 中 的 一 个 . 
对 每 个 锭 铁 , AERA UE IE] RB BE (10, 35, 
60, 85 和 100 mm) 处 得 到 5 个 拉力 样本 , 这 样 就 确 
定 了 强度 . 

a， 如 果 试 验 对 每 个 铸造 模型 一 一 方向 组 合 有 一 个 

锭 铁 , 得 到 多 少 个 强度 测量 值 ? 

b. 假定 选择 3 个 锭 铁 在 100 mm 处 做 进一步 测试 . 





Q Klassen, R. A. "The application of response surface methods to a tablet formulation problem. 


O 


w 


从 试验 的 所 有 锭 铁 中 可 以 选择 多 少 个 包含 3 个 锭 
铁 的 样本 ? 

e. 利用 表 B. 1 随机 选择 3 个 锭 铁 做 进一步 测试 . 

d. 计算 选择 的 样本 包含 了 在 试验 的 所 有 锭 铁 中 3 
个 最 大 拉力 强度 的 概率 . 

e. 计算 选择 的 样本 至 少 包含 前 3 个 最 大 拉力 锭 铁 
中 的 2 个 的 概率 . 


.79 往返 航班 中 的 危险 品 . 根据 NASA, 美国 机 群 


中 的 每 架 航天 飞机 有 1 500 个 “关键 项 目 ”, 如 果 飞 
行 中 不 能 处 理 , 将 会 导致 灾难 性 后 果 . 对 每 次 任 
务 , NASA 估计 航天 飞机 主 引擎 里 至 少 有 一 个 关键 
项 目 发 生 故 障 的 可 能 性 大 约 是 耐 . 为 了 建立 自由 号 
太空 站 , 假定 NASA 计划 在 以 后 的 10 年 里 每 年 执 
行 8 次 航天 任务 . 

a. 求 明年 计划 的 8 次 航天 飞行 中 至 少 有 1 次 关键 

"S E RH ER 


b. 求 在 今后 5 年 计划 的 40 次 航天 飞行 中 至 少 有 1 


次 发 生 关键 项 目 故 障 的 概率 . 


.80 数据 通信 系统 . 一 个 专门 研究 数据 通信 硬件 的 


公司 在 市 场 上 推销 某 种 计算 机 系统 , 它 包 括 2 种 类 
型 的 硬盘 驱动 器 、4 种 类 型 的 显示 器 和 2 种 类 型 的 
接口 . 如 果 这 家 公司 收 到 了 一 份 订单 ,其 中 包括 硬 
盘 驱 动 器 、 显 示 器 和 接口 的 每 个 可 能 组 合 , 那么 公 
司 要 安排 多 少 个 系统 ? 
81 灌注 过 程 的 可 靠 性 . 酿酒 厂 使 用 2 台 灌 注 机 
Ak. 但 它们 不 同时 运作 . 第 二 台 机 器 作为 第 一 台 
机 器 的 支持 系统 , 且 只 有 在 操作 时 间 内 当 第 一 
台 机 器 发 生 故 障 时 才 运 作 . 在 操作 时 间 第 一 台 机 
器 发 生 故 障 的 概率 是 0. 20. 实际 上 , 如 果 第 一 台 
发 生 故 障 , 那么 开动 第 二 台 , 故障 的 概率 
是 0. 30. 
a. 酿酒 三 的 灌注 系统 在 操作 时 间 内 不 能 工作 的 概 
率 是 多 少 ? 
b. 灌注 过 程 的 可 靠 性 是 系统 在 操作 时 间 内 工作 的 
概率 . 求 酿酒 厂 灌注 过 程 的 可 靠 性 . 
82 RET RAM E AA 
(NASA) 购买 了 一 个 新 型 太阳 能 电池 ，, 保证 只 
1/20 的 故障 率 . 一 个 用 于 太空 SABES 


”文章 发 表 在 Joint Statistical 


Meetings, American Statistical Association and Biometric Society. 1986 年 8 月 ， 芝加哥 ,IL. 
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靠 这 些 电池 运行 . 为 了 增加 系统 的 可 靠 性 ，NASA 
安装 了 三 个 电池 , 每 个 都 这 样 设计 : 如 果 电 路 中 前 
一 个 电池 发 生 故 障 , 就 会 运行 . 如 果 系 统 在 某 种 实 
际 情况 下 操作 , 所 有 三 个 电池 均 发 生 故 障 的 概率 


是 多 少 ? 


.83 石油 勘探 中 的 风险 . 石油 勘探 业务 的 管理 者 作 


出 了 决定 , 勘探 工作 部 分 地 基于 与 每 次 冒险 关联 
的 风险 水 平 而 进行 的 ,Kinchen (1986) 利 用 单个 勘 
探 的 结果 与 关联 概率 ( 见 下 表 ) 检 查 了 石油 开采 中 
的 风险 分 析 问 题 . 





产 出 的 桶 数 W m 
0( 干 洞 ) 0. 60 
50 000 0.10 
100 000 0.15 
500 000 0.10 
1 000 000 0.05 


资料 来 源 : Kinchen, A. L. ^ Projected outcomes of explora- 
tion programs based on current program status and the impact 
of prospects under consideration. " Journal of Petroleum Tech- 


nology, Vol. 38, No. 4, Apr. 1986, p. 462. 


a. 单个 油 并 勘探 得 到 不 超过 100 000 桶 石油 的 概率 
是 多 少 ? 

b. 单个 油井 勘探 发 现 石油 的 概率 是 多 少 ? 

e. Kinchen 也 考虑 了 2 次 相同 的 油井 勘探 . 如 果 钻 
了 2 AJF, 那么 列 出 可 能 的 结果 ( 即 简单 事件 ). 
假定 对 于 任意 一 口 并 , 表 中 只 列 出 一 种 可 能 的 
结果 . (提示 : 一 个 可 能 的 简单 事件 是 2 个 干 
EJ. ) 

d. 利用 表 中 的 信息 计算 e 中 简单 事件 的 概率 . CF 
XE 2 口 井 的 单个 结果 是 相互 独立 的 . ) 

e. 根据 d. 求 2 次 石油 勘探 中 至 少 有 -次 能 发 现 石 
油 的 概率 . 


“3. 84 电 熔 丝 生产 . 一 个 生产 过 程 利用 2 条 生产 线 


装配 电 熔 丝 . 2 条 生产 线 以 相同 速度 生产 电 熔 丝 ， 
且 在 一 般 情况 下 , 生产 的 电 熔 丝 有 2. 5% RB k ë 
的 . 但 是 第 1 条 生产 线 最 近 遇 到 了 机 械 上 的 难题 ， 
在 3 个 星期 内 生产 了 6. 0% 的 缺陷 产品 , 直到 这 有 段 
时 间 内 生产 的 几 批 电 熔 丝 运送 到 顾客 时 才 发 现 这 
种 情况 . 如 果 顾 客 测试 2 AEIR, 发 现 一 个 是 有 
缺陷 的 , 它 来 自 的 那 批 产品 是 由 生产 线 1 生产 的 概 
率 是 多 少 ? (假定 那 批 产品 中 所 有 的 电 熔 丝 都 是 由 
同一 条 线 生产 的 . ) 


3.85 原材料 供应 商 的 选择 权 , 为 了 保证 原材料 发 
送 , 一 家 公司 决定 与 至 少 2 个 潜在 供应 商 建立 购买 
模式 . 如 果 有 5 个 适用 的 供应 商 , 那么 公司 有 和 多少 
种 选择 ? l 

3.86 非法 侵入 卫星 TV. 最 近 有 :个 法 庭 案件 涉及 
对 非法 接 入 地 方 电视 台 的 卫星 电视 用 户 的 索赔 . 被 
告 (卫星 电视 公司 ) 想 对 全 国 范围 内 的 电视 市 场 进 
行 抽样 来 确定 每 个 抽样 的 市 场 中 非法 接 人 地 方 电 
视 台 用 户 的 百分比 . 为 了 做 这 件 事 , 被 告 方 专家 将 
美国 大 陆 划 成 一 个 长 方形 格子 , 并 在 每 0.02° 的 经 
度 和 纬度 上 分 别 画 水 平 线 和 垂直 线 ， 一 共产 咎 了 
500 行 和 1000 列 , 或 者 (500) (1000) = 500 000 个 
交叉 点 . 计划 是 随机 抽取 900 个 交叉 点 ,并 将 每 个 
交叉 点 处 的 电视 市 场 作为 样本 . 解释 怎样 利用 随机 
数 发 生 器 获得 900 个 交叉 点 的 随机 样本 . 

.87 ”随机 数字 拨号 . 为 了 确定 广告 战 的 效力 , 一 些 
公司 频繁 地 用 随机 数字 拨号 对 顾客 进行 电话 采访 . 
用 这 种 方法 , 随机 数 发 生 器 机 械 地 产生 呼叫 的 电 
话 号 码 样本 . 

a. 解释 怎样 利用 随机 数 表 ( 表 B. 1) 或 者 计算 机 产 
生 7 位 数字 的 电话 号 码 的 样本 . 

b. 利用 a 中 描述 的 程序 产生 1 个 7 位 的 电话 号 码 
的 样本 . 

c. 利用 a 中 描述 的 程序 产生 5 个 7 位 数字 生前 三 
位 为 373 的 电话 号 码 . 

选 做 的 补充 练习 

3. 88 调制 解 调 器 供应 商 . 计算 机 路 由 器 和 调制 解 调 
器 的 装配 工 使 用 两 种 来 源 的 部 件 . 公司 A 提供 
80% 的 部 件 , 公司 B 提供 剩 下 的 20% 部 件 . 根据 过 
去 的 经 验 , 装配 工 知道 由 公司 A 提供 的 部 件 5% 有 
缺陷 , 由 公司 B 提供 的 部 分 3% 有 缺陷 . 随机 选择 
一 个 装配 好 的 调制 解 调 器 , 发 现 它 是 有 缺陷 的 部 
件 . 两 家 公司 中 的 哪 家 更 可 能 提供 了 有 缺陷 的 
部 件 ? 

3.89 DOT 合 同 的 投标 . 5 家 建筑 公司 都 投标 了 3 份 
不 同 运 输 部 门 (DOT) 的 合同 . 一 家 公司 最 多 签约 一 
f DOT 合同 . 

a 可 以 有 多 少 种 不 同 的 方法 中 标 ? 

b. 在 简单 事件 都 是 等 可 能 的 假定 下 , 求 公司 E 
约 一 份 DOT 合同 的 概率 . 

c. 假定 公司 4 和 5 已 经 提交 了 无 竞争 性 的 投标 . 如 
采 合 同 是 由 DOT 随机 授予 的 , 求 这 两 家 公司 都 
签约 合同 的 概率 . 


Co 
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3.90 编写 一 个 C++ 程序 . 值 . ) 
a 一 位 教授 要 求 他 的 学 生 编 写 一 个 C++ 程序 , 打 3.92 HARIA. 参看 例 3. 19. 
印 所 有 由 5 个 字母 A, B, E,T 和 0 组 成 的 三 字 a 已 知 晴天 , 求 探测 到 一 个 冯 和 人 者 的 概率 . 


母 序列 . 需要 打印 多 少 不 同 的 三 字母 序列 ? b. 已 知 阴 天 , 求 探测 到 一 个 冯 人 者 的 概率 . 
b. 修改 程序 , 使 得 每 个 三 字母 序列 至 少 有 一 个 元 3.93 有 缺陷 的 奔腾 处 理 器 芯片 . 1994 年 10 月 ,发 
音字 母 , 且 没 有 重复 的 字母 , 回答 a 的 问题 . 现 安装 在 个 人 电脑 里 的 奔腾 微 芯片 的 一 个 缺陷 . 当 
3.91 稀有 扑克 上 牌 . 考虑 从 一 副 标 准 52 张 纸牌 中 抽 2 个 数字 相 除 时 , 这 个 芯片 产生 不 正确 的 结果 . 黄 
出 5 张 . 两 个 重要 的 事件 是 : 特 尔 (奔腾 芯片 的 制造 商 ) 开始 声明 这 种 错误 在 每 
A: | 你 得 到 了 一 组 同 花 色 的 牌 } 90 亿 次 除法 中 会 出 现 1 K, 或 者 对 于 一 个 普通 用 
Bi | 你 得 到 了 一 个 顺 子 } 户 , 每 27 000 年 才 出 现 1 次 ; 因此 , 没有 立即 更 换 

a. 求 P(A). 芯片 . 

b. >+ P(B). 依靠 程序 , 统计 软件 包 ( SAS) 为 了 产生 需 
c 4 和 B 都 发 生 事 件 ， 即 Ann B, 称 作 同花顺 . 要 的 输出 , 可 能 要 执行 大 量 的 除法 . 对 重型 的 软件 
XP(AnB). 用 户 , 在 一 个 短 时 间 段 内 进行 10 亿 次 除法 是 正常 


(GE: 一 组 同 花 由 任意 5 张 同 花 色 的 牌 组 成 . 一 个 的 . 对 于 一 个 重型 的 SAS 用 户 , E REGE RSS P 
顺 子 由 任意 一 连 串 5 张 牌 组 成 . 在 一 个 顺 子 里 , 这 为 问题 吗 ? (xi 在 瑕 辛 发 现 2 个 月 后 , 英特尔 同 
些 牌 可 能 是 任意 花色 的 , A 看 作 值 1 或 比 K 更 大 的 意 免费 蔡 换 所 有 的 奔腾 芯片 . ) 


活动 中 的 统计 学 : NASA 太空 船 仪表 码 中 的 软件 缺陷 评估 预测 器 

软件 工程 师 负责 测试 和 评估 计算 机 软件 代码 . 一 般 地 ， 评价 越 严 格 成 本 越 高 . 给 定 有 限 的 预算 ， 
软件 工程 师 通常 注意 其 认为 是 最 重要 的 代码 . 因此 ， 这 个 软件 代码 剩 下 的 部 分 ( 称 作 “ 育 点 ” ) 可 能 包 
含 未 发 现 的 缺陷 . 例如 ,Journal of Systems and Software(2003 年 2 月) 刊登 了 NASA 外 层 空 间 卫 星 的 有 
缺陷 的 基础 软件 . NASA 工程 师 集 中 于 比较 关键 的 飞行 软件 代码 ; 但 是 ， 有 缺陷 的 基础 软件 一 直 没 有 
正确 地 从 飞行 软件 收集 数据 ,从 而 导致 了 卫星 的 关键 问题 . 

最 近 , 西 弗吉尼亚 大 学 计算 科学 与 电气 工程 系 的 Tim Menzies 教授 和 Justin DiStefano 教授 提出 了 
软件 代码 评估 中 的 “盲点 "问题 ©, 研究 人 员 也 提出 了 一 些 评估 探测 软件 缺陷 不 同方 法 的 准则 Q. 这 
些 方法 应 用 到 各 种 数据 集 ， 其 中 一 个 是 活动 中 的 统计 学 的 应 用 焦点 . 保存 在 SWDEFECTS 文件 中 的 
数据 可 以 从 由 瀑 太 华 大 学 信息 技术 与 工程 学 院 所 持 有 的 PROMISE 软件 工程 知识 库 中 免费 获取 . 数据 
包括 为 一 个 NASA 太空 船 仪表 以 “C" 语 言 编写 的 498 个 软件 代码 模块 . 

对 每 个 模块 ,一行 一 行 地 评估 软件 代码 的 缺陷 , 并 将 模块 分 为 “true 《 即 模块 有 缺陷 的 代码 ) 或 
者 "false”( 即 模块 有 正确 的 代码 ). 由 于 一 行 一 行 地 检查 代码 非常 耗费 时 间 和 金钱 , 因此 研究 员 考 虑 
利用 一 些 简 单 、 容 易 应 用 的 算法 来 预测 一 个 模块 是 否 有 缺陷 , 例如 , 一 个 简单 的 算法 是 数 出 模块 中 
代码 的 行 数 , 例如 , 任意 一 个 有 100 行 或 者 更 多 行 代码 的 模块 被 预测 有 一 个 缺陷 . 表 SIA. 1 列 出 了 
一 些 预 测 方 法 . SWDEFECTS 文件 包含 一 个 相应 于 每 个 方法 的 变量 . 当 方法 预测 到 一 个 缺陷 时 ,相应 
的 变量 值 为 “Yes”; 否则 是 “No”. 





O Menzies, T. , fil DiStefano, J. “How good is your blind spot sampling policy?" , 8th IEEE International Symposium on High As- 
surance Software Engineering , 2004 年 3 月 . ` 

O Menzies, T. , DiStefano, J. , Orrego, À. , ， 和 Chapman, R. " Assessing predictors yf software defects. " Proceedings , Workshop 
on Predictive Software Models, 5 8p, 2004. 
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表 SIA3. 1 软件 缺陷 预测 算法 





方 法 缺陷 算法 © Xx 
代码 行 数 LOC >50 LOC = 代码 行 数 
循环 复杂 度 v(g) >10 v(g) = 线性 独立 路 径 的 个 数 
基本 复杂 度 elg) z14. 5 ev(g) = D 结构 质数 机 的 子 流向 图 个 数 
设计 复杂 度 iv(g) 29.2 iv(g) = 简化 模块 流向 图 的 循环 复杂 度 


评估 软件 缺陷 预测 算法 的 标准 方法 是 形成 一 个 类 似 于 表 SIA. 2 的 双向 汇总 表 . 在 这 个 表 中 ， a, 
b, c 和 d 代表 每 个 单元 中 的 模块 个 数 . 

软件 工程 师 利 用 这 些 表 的 条 目 计算 一 些 概 率 度 量 : 正确 度 、 检 出 率 、 假 警报 率 和 精确 度 . 这 些 度 
量 定 义 如 下 : 


、 (a * d) u 
ERR: 。P( 算 法 是 正确 的 ) = 一 +5 一. 表 SIA3.2 WISH 
(a tb ves D 巴 测 算法 的 汇总 表 
检 出 率 : ”PR( 预 测 到 缺陷 1 模块 有 缺陷 ) "ids 模块 有 缺陷 
假 真 





BERE: P( 预测 到 缺陷 1 模块 没有 缺陷 ) = Gm LY EE x 7. 7 


测 到 缺陷 A c d 





精确 度 ， P( 模块 有 缺陷 1 预测 到 缺陷 ) = 7 - 


你 可 以 看 到 这 些 概率 中 的 每 个 都 利用 了 本 章 定 义 的 概率 法 则 之 一 . 例如 , 检 出 率 是 已 知 模块 实 
际 上 有 缺陷 , 算法 预测 到 缺陷 的 概率 , 这 个 条 件 概率 是 将 样本 空间 限制 为 已 知事 件 “ 模 块 有 缺陷 ”时 
求 得 的 . 因此 分 母 即 为 有 缺陷 的 模块 数 5 + d. 

我 们 利用 SPSS 为 SWDEFECTS 文件 中 的 数据 建立 类 似 于 表 SIA3. 1 的 汇总 表 . SPSS 的 输出 结果 
见 图 SIA3. 1. 首先 考虑 利用 算法 LOC > 50 的 预测 模型 . 根据 图 SIA3. 1 中 最 上 面 表 的 结果 可 以 得 到 下 
面 的 LOC 预测 器 的 概率 度量 : 

正确 度 ; P( 算 法 是 正确 的 ) = (400 +20)/(400 +29 +49 +20) =420/498 =0. 843. 

检 出 率 : P( 预 测 到 缺陷 | 模块 有 缺陷 ) =20/(29 +20) =20/49 =0. 408. 

假 警 报 率 : P 预测 到 缺陷 1 模块 没有 缺陷 ) =40/(400 +49) -40/449 = 0. 089. 

精确 度 ; P( 模 型 有 缺陷 1 预测 到 缺陷 ) =20/(49 +20) 220/69 =0. 290. 

算法 正确 地 预测 一 个 缺陷 的 概率 是 0. 843 一 一 一 个 非常 高 的 概率 . 还 有 , 假 警报 概率 只 有 0. 089 , 
即 仅 有 9% 的 可 能 性 是 当 不 存在 缺陷 时 算法 预测 一 个 缺陷 . 但 是 , 其 他 概率 测量 值 , 检 出 率 和 精确 度 
分 别 仅 有 0. 408 和 0. 290. 这 个 算法 如 此 低 的 检 出 率 可 能 令 软 件 工程 师 关 心 ; 已 知 模块 有 -一 个 缺陷 ， 
只 有 大 约 40% 的 可 能 性 算法 探测 到 缺陷 . 

对 于 其 他 三 个 预测 算法 可 以 进行 类 似 的 计算 . 这 些 概 率 测量 值 见 表 SIA3. 3. 为 了 比较 , 我 们 将 每 
栏 中 “最 好 ”的 概率 测量 值 用 黑体 显示 . 你 可 以 看 到 基本 复杂 度 方法 (如 果 elg) >14. 5 预测 到 缺陷 ) 
有 最 高 的 正确 度 和 最 低 的 假 警 报 概率 ，LOC 方法 (如 果 代 码 行 数 > 50 预测 到 缺陷 ) 有 最 高 检 出 概率 
和 最 高 的 精确 度 . 研究 人 员 证 明 没有 一 种 方法 能 产生 所 有 4 个 概率 测度 都 是 最 优 的 . 

关于 诸如 此 类 更 复杂 的 检测 算法 的 分 析 , 研究 人 员 对 缺陷 预测 算法 的 选择 给 出 一 些 建议 . 他 们 
最 终 认为 对 任意 一 个 软件 项 目 , 都 可 以 找到 一 个 好 的 缺陷 探测 器 . 
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PRED_ VG * DEFECT Crosstabulation 
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PRED IVG * DEFECT Crosstabulation 
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图 SIA3.1 ”预测 软件 缺陷 的 双向 汇总 表 

表 SIA3. 3 评估 缺陷 预测 算法 的 概率 度量 








F> 3X 正确 m 检 出 率 假 警 报 率 精 确 度 
代码 行 数 0. 843 0. 408 0.089 0.290 
循环 复杂 度 0. 825 0.286 0.116 ` 0. 212 
基本 复杂 度 0. 890 0. 041 0. 018 0. 200 


设计 复杂 度 0. 869 0. 224 0. 060 0. 289 


第 4 章 离散 随机 变量 


目标 “解释 离散 随机 变量 、 它 的 概率 分 布 和 相应 的 数值 描述 性 度量 表示 什么 ; 给 出 一 些 实用 的 
离散 概率 分 布 ， 并 说 明 它们 如 何 用 于 解决 实际 问题 


4.1 离散 随机 变量 的 定义 


在 第 1 章 , 我 们 注意 到 , 最 关心 的 试验 事件 通常 是 用 数字 表示 的 ， 即 我 们 做 试验 并 观察 一 些 变 
量 的 数值 . 如 果 重 复试 验 n Uc, 我 们 得 到 一 个 定量 数据 样本 . 为 了 说 明 问题 ， 假设 一 种 产品 (例如 机 
带 零 件 ) 按 批 销售 , 每 批 20 箱 , 每 箱 有 12 件 产品 . 在 进行 产品 的 质量 检验 时 ， 一 个 工序 主管 工程 师 
从 240 件 为 一 批 的 产品 中 随机 地 选 出 4 件 产品 进行 检验 , 确定 这 4 件 产品 是 否 为 有 缺陷 产品 . 如 果 发 
现 有 缺陷 产品 超过 了 1 PE, 则 整 批 产品 将 被 拒绝 . 


从 240 件 产品 中 选 出 4 件 产 品 产 生 一 个 翌 本 空间 5， 其 中 包括 { “4 个 简单 事件 ,每 个 简单 事件 


均 是 从 这 批 产品 中 选 出 4 件 产品 时 一 种 可 能 的 组 合 * 尽管 某 些 简单 事件 对 样本 中 4 件 产品 的 描述 是 
相同 的 , 但 是 , 工序 主管 工程 师 关心 的 事件 是 观测 变量 Y, 变量 了 表示 被 检验 的 4 件 产品 中 有 缺陷 产 
品 的 数量 样本 空间 S 中 的 每 个 简单 事件 都 对 应 着 变量 了 的 一 个 值 而 且 仅 一 个 值 . 从 而 , 样本 空间 S 
中 的 简单 事件 和 变量 了 的 可 能 值 之 间 存 在 着 一 种 函数 关系 . 事件 了 =0 表示 4 件 产品 中 没有 缺陷 产品 
的 简单 事件 集合 . 类 似 地 , 事件 了 = 1 表示 4 件 产 品 中 有 1 件 缺 陷 产 品 的 简单 事件 集合 . 由 于 了 的 可 
能 值 是 一 个 用 数字 表示 的 事件 ( 即 在 试验 不 断 进行 时 ， 以 随机 变化 方式 的 某 些 数字 定义 的 事件 ), 称 
Y 为 一 个 随机 变量 . | 

定义 4.1 随机 变量 了 是 一 个 定义 在 样本 空间 上 的 数值 函数 ,样本 空间 中 的 每 个 简单 事件 都 被 
指派 一 个 了 值 . 

从 240 件 产品 中 选 出 4 件 产 品 进行 检验 , 其 中 缺陷 产品 的 数量 了 是 一 个 可 能 取 可 数 个 值 的 离散 
随机 变量 . 在 这 个 例子 中 , 随机 变量 了 可 以 取 0, 1,2,3,4 这 5 个 值 中 的 任何 一 个 . 又 如 ,一 个 C + 
软件 程序 中 代码 的 行 数 了 也 是 一 个 离散 随机 变量 . 理论 上 ， 这 个 随机 变量 的 值 可 以 大 到 超过 所 有 的 
界 , 这 个 离散 随机 变量 的 可 能 值 相应 于 非 负 整数 , Y=0, 1,2,3, =, om, 这 些 值 的 个 数 是 可 数 的 . 

在 自然 界 中 观测 到 的 随机 变量 通常 具有 相似 的 特征 ， 所 以 能 按照 类 型 分 类 . 在 本 章 , 我 们 将 学 
习 7 种 不 同类 型 的 离散 随机 变量 , 并 且 用 第 3 章 的 方法 求 出 每 个 可 能 值 的 概率 . 关于 如 何 用 观测 到 
的 样本 数据 的 概率 进行 统计 推断 , 我 们 从 介绍 一 些 直观 的 概念 开始 . 

定义 4.2 ”离散 随机 变量 了 是 一 个 仅 能 取 可 数 个 值 的 变量 . 


4.2 离散 随机 变量 的 概率 分 布 


随机 变量 了 的 可 能 取 值 是 数值 事件 , 我 们 希望 计算 事件 的 概率 . 给 出 这 些 概率 的 表 、 公 式 或 图 
形 称 作 随 机 变量 了 的 概率 分 布 . 概率 论 中 通常 假定 用 大 写字 母 表示 随机 变量 (如 了 )， 小 写字 母 (如 
7) 表 示 随 机 变量 可 能 取 到 的 具体 数值 . 所 以 , 对 每 个 可 能 值 y, 我 们 想 求 出 表示 概率 P(Y =y) 的 表 、 
图 或 公式 . 为 了 简化 记号 , 有 时 我 们 用 p(y) 表示 P(Y=y). 

我 们 将 用 简单 的 掷 硬币 的 例子 来 说 明 这 个 概念 . 
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Yr HOS] BE TEHEHDE2 次 , SRE HALTE EU OC Y. 求 了 的 概率 分 布 . 


解 WH,T(i-z1, 2) SIRRA LUCERE TD H B 89 TE TT 
与 反面 . 表 4. 1 显示 了 4 个 简单 事件 及 相应 的 了 值 , 了 可 能 取 值 
0, 1 或 2. 

事件 Y=0 表示 所 有 出 现 正面 的 次 数 为 0 的 简单 事件 集合 ， 
即 只 有 简单 事件 E,. 因此 了 取 值 为 0 的 概率 是 : 


P(Y=0) =p(0) =P(E,) =+ 


事件 Y=1 包括 2 个 简单 事件 E, 和 Es, 因此， 


P(Y=1) =p(1) =P(E,) +P(E;) = 地 + 六 = 六 
最 后 
P(Y=2) =p(2) =P(E,) =} 


概率 分 布 P(y) 在 表 4.2 中 以 表 的 形式 给 出 , 在 图 4.1 中 以 
线 图 形式 给 出 . 注意 图 4. 1, 相应 于 y 的 概率 是 用 竖 线 表 示 的 , tz 
线 的 长 度 与 P(y) 的 值 成 比例 . 在 4. 6 节 中 , 我们 将 说 明 这 个 概率 
分 布 也 能 用 公式 


给 出 , 其 中 





表 4. 1 撕 硬 币 试验 的 结果 
MA oa pe, EMKA 
事件 WE POD Y=y 
E, H, H, I 2 

E, H T, T 1 

E, T, H, + 1 

E, TT, 1l. 0 

4 





34.2 2 次 掷 硬币 中 正面 
次 数 Y 的 概率 分 布 
Yzy 





p(y) 
1 
0 4 
1 
1 2 
d. 
4 


2 


Mr = 1 
y 





p(y) 


LLLI. 


图 4.1 2 KRANE 1E i 
次 数 了 的 概率 分 布 





R, 图 或 公式 中 的 任何 一 种 方式 可 用 来 表示 离散 随机 变量 了 的 概率 分 布 . 
定义 4.3 ”离散 随机 变量 了 的 概率 分 布 是 给 出 了 的 每 个 可 能 取 值 了 = y 以 及 相应 概率 p(y) 的 


表 、 图 或 公式 ， 


离散 随机 变量 的 概率 分 布 p(y) 必须 满足 两 条 性 质 : 58 —, 由 于 p(y) 是 一 个 概率 值 , 所 以 必须 满 
AE 0=<p(y)<1; 第 二 ,了 的 所 有 可 能 取 值 所 对 应 的 p(y) 的 和 是 1. 因为 样本 空间 8 中 的 每 个 简单 事件 
首 派 且 仅 指派 一 个 Y 值 , 所 以 第 二 条 性 质 是 正确 的 . 而 了 的 可 能 取 值 代表 简单 事件 的 不 同 集合 ,所 
以 是 互 斥 事件 . 对 了 的 所 有 可 能 取 值 对 应 的 P(y) 求 和 等 价 于 对 8 中 的 所 有 简单 事件 的 概率 求 和 , 3. 2 


节 中 已 经 知道 PCS) SF 1. 








离散 概率 分 布 满足 的 条 件 
1. 0=p(y) si 


2. 220 -1 


EER 国家 高 速 公路 交通 安全 管理 部 门 ( NHTSA) 已 经 对 司机 座 进 行 撞击 测试 的 新 汽车 制定 了 星 
级 评定 系统 . 给 每 辆 接受 撞击 测试 的 汽车 进行 等 级 评定 , 从 一 颗 星 到 五 颗 星 . 星 越 多 的 等 级 表示 在 磁 
撞 事 故 中 保护 头 部 撞击 的 水 平 越 高 . 文件 CRASH 记录 了 最 近 的 98 辆 新 汽车 的 数据 , 图 4.2 的 
MINITAB 输出 结果 给 出 了 这 些 车 辆 司机 座 不 同 星 级 车 辆 的 百分数 . 假设 从 98 辆 车 中 随 轴 地 这 出 
辆 , 令 Y 等 于 这 辆 车 司机 座 等 级 中 星 的 个 数 , 用 输出 的 数据 求 了 的 概率 分 布 , 然后 求 P(Y<3). 

解 ” 由 于 司机 座 星 级 范围 从 1 到 5, 因此 离散 随机 变量 了 的 可 能 取 
值 为 1,2,3,4,5. MINITAB 打印 输出 给 出 了 CRASH 文件 中 98 辆 车 的 每 个 
星 级 的 百分数 . 随机 选 出 一 辆 车 , 它 是 某 一 星 级 的 概率 就 是 这 个 百分数 . 
由 于 98 辆 车 中 没有 1 辆 车 是 一 星 级 的 , 因此 P(Y=1) =p(1) =0. 了 取 其 
他 值 的 概率 如 下 : p (2) 20.048, p(3) =0.1735, p (4) = 0.600, 
p(5) 20.1837. 显然 , 这 些 概率 的 和 为 1. 











Tally for Discrete Variables: DRIVSTAR 
DRIVSTAR Count Percent 





图 4.2 司机 座 星 级 的 
为 了 求 P(Y<3)， RITHE pA), p(2) & p( 3)oR RI MINITAB 概要 


P(Yx3) =p(1) *p(2) +p(3) =0 +0. 0408 40.1735 =0. 2143 





因此 , 大 约 有 21% 的 汽车 司机 座 星 级 是 三 颗 或 更 少 的 星 ， 
最 后 ,我 们 将 讨论 离散 随机 变量 的 概率 分 布 和 数据 的 相 
对 频率 分 布 (在 2.2 节 中 讨论 ) 之 间 的 关系 . 假设 你 重复 掷 两 
枚 硬币 很 多 次 , 并 将 每 次 掷 出 硬币 出 现 正面 的 次 数 了 记录 下 
来 得 到 的 0，1 ,2 集合 的 相对 频率 直方 图 中 有 三 条 高 度 分 别 
WURST, ys IURE. 实际 上 ,如 果 可 以 重复 试验 无 限 多 
次 ,分布 将 如 图 4 3 所 示 . 这 样 ,图 4.3 的 概率 直方 图 就 给 出 ”图 4 3 两 次 痢 硬 币 中 正面 次 数 











了 了 了 值 的 概念 总 体 一 一 车 试验 重复 无 限 多 次 , 观测 到 的 了 值 了 的 理论 相对 频率 直方 图 
的 模型 . 
在 4 5 节 开 头 , 我 们 将 介绍 一 些 出 现在 物理 学 、 生 物 学 、 社 会 学 和 信息 科学 中 的 离散 随机 变量 模型. 
(8) 应 用 练习 叶片 上 卵 的 数量 了 Y, 写 出 了 的 概率 分 布 . 
4 1 控制 水 葫芦 昆虫 学 工程 师 一 直 在 寻找 产 的 生 。 P 在 一 片上 至 少 有 3 个 卵 的 概率 是 多 少 ? 
物 试剂 来 控制 全 世界 最 差 的 水 中 杂 草 之 一 : JK ji 1/88 288 3458 44858 
Pr. 飞 乔 是 一 种 靠 水 戎 总 生存 的 昆虫 , 只 性 飞 剧 在 叶片 百分数 40 54 2 4 
水 萌 芦 叶片 上 随意 产 下 1 ~ 4 个 卵 . Annals of the 资料 来 源 : Sosa, A. J., et al. “Life history of Megamelus 
Entomological Society of America ( 2005 年 1 月 ) 发 表 scutellaris with description of immature stages”, Annals of the 
了 关于 南美 飞 乱 科 物 种 生命 周期 的 研究 ， 附 表 给 Entomological Society of America , Vol. 98, No. 1, Jan. 2005 
H T IKE ERE Ef 1 4.2 43 个 .4 个 卵 的 百 (摘自 表 D. 
分 数 . 4.2 DREE. 灰尘 中 小 螨 变态 反应 原水 平 超 


a 随机 选取 一 个 所 研究 的 水 萌 芦 叶片 ， 观测 这 个 过 2 pag 时 , 就 会 引起 过 敏 症 . 考虑 4 个 家 庭 的 随 
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机 样本 , 了 为 尘 螨 水 平 超过 2 pg/g 的 家 庭 数量 . 根 
据 美国 环境 健康 科学 研究 所 2000 年 5 月 的 研究 报 
告 得 出 了 的 概率 分 布 见 下 表 . 


y 0 1 2 3 4 





p(y) 0.09 030 037 0.20 0.04 


验证 表 中 了 的 概率 和 为 1. 

b. 求 样本 中 有 3 个 或 4 个 家 庭 侍 螨 水 平 超过 2 ug 
的 概率 . 

求 样 本 中 尘 螨 水 平 超过 2 ug/g 的 家 庭 少 于 2 个 
的 概率 . 

.3 污染 的 枪弹 . 一 个 武器 制造 商 利 用 液体 发 射 剂 
制造 枪弹 ,在 生产 过 程 中 , 发 射 剂 可 能 与 其 他 液 
体 混合 生产 出 污染 的 枪弹. 公司 聘请 南 佛罗里达 
大 学 的 统计 学 家 调查 储存 的 枪弹 的 污染 程度 , 结 
果 在 一 批 枪 弹 中 发 现 23% 被 污染 了 . 假设 你 从 这 
批 枪弹 中 随机 地 抽样 (不 放 回 ) 直 到 抽出 一 个 污染 
的 枪弹 . 令 了 表示 直到 抽出 一 个 污染 的 枪弹 时 已 
抽出 的 枪弹 个 数 . 已 知 了 的 概率 分 布 由 下 面 的 公 
AB 
p(y) 2(0.23)(0. 77), y 21,2,3, > 

A pO) , 解释 这 个 结果 . 

. OR p(5) , 解释 这 个 结果 . 

o P(Y22) ,解释 这 个 结果 . 
海滩 侵蚀 热 区 . 参考 练习 2.3, 美国 陆军 工兵 部 
队 对 海滩 侵蚀 热 区 的 研究 . 下 面 表 中 给 出 了 6 个 海 

滩 侵 蚀 热 区 近 滨 堤 坝 的 条 件 . 假设 你 从 这 6 个 海滩 

热 区 中 随机 选 2 个 , 数 一 数 这 个 样本 中 有 平坦 的 近 

滨 坦 坝 的 海滩 个 数 Y. 

a. 从 6 个 海滩 侵蚀 热 区 中 任 选 2 个 , 列 出 所 有 可 
能 的 选 法 . 

. 写 出 a 中 结果 的 概率 . 

， 对 a 中 每 个 结果 , 确定 了 的 值 . 

. 列 出 了 的 概率 分 布 表 . 

. 求 样本 中 至 少 有 一 个 平坦 的 近 滨 堤坝 海滩 的 


p 


° 


mp 


Ao 


€ aa tc 








海滩 热 区 近 滨 堤坝 条 件 
Miami Beach, FL 单一 的 , 海岸 平行 
Coney Island, NY 其 他 


Surfside, CA 单一 的 , 海岸 平行 








( 续 ) 
海滩 热 区 近 滨 堤坝 条 件 
Monmouth Beach, NJ 平坦 的 
Ocean City, NJ 其 他 
Spring Lake，NJ 平坦 的 
A RÆ: “Identification and characterization of erosional 


hotspots. ” William & Mary Virginia Institute of Marine Sci- 
ence, U. S. Army Corps of Engineers Project Report, March, 
18, 2002. 


.5 机 器 人 感应 器 系统 结构 , Broadcom 公司 的 工程 


师 和 Simon Fraser 大 学 联合 研究 的 未 知 环境 中 机 器 
人 感应 器 系统 (The International Journal of Robotics 
Research , 2004 年 12 H. ). 作为 一 个 例子 , 下面 显 
示 了 工程 师 标 出 的 单 连 接 机 器 人 系统 的 三 个 点 . 系 
统 的 物理 空间 中 的 每 个 点 (A、B 或 C) 要 么 作为 
“障碍 ”状态 , 要 么 处 于 “自由 "状态 . 在 系统 中 有 两 
个 连接 : AGB 及 BoC. 连接 处 于 自由 状态 当 且 仅 
当 连 接 中 两 个 点 是 “自由”, 否则 连接 处 于 “障碍 ” 
状态 . 我 们 关心 的 是 随机 变量 Y, 即 系统 中 处 于 “ 自 
由 ”状态 的 连接 个 数 . 





a， 写 出 这 个 系统 的 了 可 能 取 值 . 

b. 研究 人 员 提 出 系统 中 任何 一 点 处 于 “自由 ”状态 
的 概率 都 是 0. 5, 假设 系统 中 三 个 点 的 运转 是 独 
立 的 , 求 了 的 概率 分 布 . 


.6 有 继电器 的 电路 . 如 下 图 所 示 , 考虑 有 三 个 继 


电器 的 一 段 电路 . 当 开关 接 通 时 , 如 果 至 少 有 一 个 
通路 , 电流 将 从 A 流 到 B. 当 开关 接 通 时 ,三 个 继 
电器 中 的 每 一 个 都 有 相同 的 机 会 保持 开 或 关 , Ç Y 


表示 开关 接 通 时 关闭 的 继电器 个 数 
@ 
A B 


O 


a. 求 了 的 概率 分 布 , 并 以 表格 形式 表示 . 
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b. 电流 从 A 到 B 的 概率 是 多 少 ? 

4.7 桥接 网 络 的 可 靠 性 . 由 中 国 大 学 教授 组 成 的 小 
组 在 Networks( 1995 年 5 月 ) 杂 志 中 研究 了 几 个 容 
E -流量 网 络 的 可 靠 性 . 文章 中 测试 的 一 个 网 络 是 
ABM a, a, a, a, a, 和 us 桥接 的 网 络 . FE 
中 给 出 了 每 个 电弧 的 电容 量 了 的 概率 分 布 . 








电弧 Ey ply) 电弧 Ey ply) 
Qi 3 0. 60 [^ 1 0. 90 
2 0. 25 0 0. 10 

1 0. 10 

0 0.05 
a, 2 0.60 as 1 0. 90 
1 0. 30 0 0.10 

0 0.10 
as 1 0.90 [^ 2 0. 70 
0 0.10 1 0.25 
0 0. 05 








— — —— — _  _ 1 
资料 来 源 : Lin, J., et al. “On reliability evaluation of capac- 
itated-flow network in terms of minimal pathsets. " Networks , 


Vol. 25, No. 3, May 1995, p. 135 (3€ 1). 


a a 
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a. 验证 每 个 电弧 电容 量 的 分 布 都 满足 离散 概率 分 


4.3 随机 变量 的 期 望 值 


布 的 性 质 . 

b. 求 电弧 o, 的 电容 量 超过 1 的 概率 . 

c. 对 其 他 5 个 电弧 重复 上 . 

d. 由 起 始 节点 到 嵌入 节点 的 一 条 路 通过 电弧 c 和 
a 求 通过 a, - a, 路 线 系统 保持 电容 量 大 于 1 
的 概率 .〈 假 定 电弧 容量 是 独立 的 . ) 

e. 由 起 始 节点 到 藤 人 节点 的 另 一 条 路 线 是 通过 
a, , a, 和 as, 求 通过 a, - a, - as 路 线 系 统 保持 
电容 量 为 1 的 概率 . 

.8 更 换 切 前 工具 . 参考 练习 3.57 , Journal of Engi- 

neering for Industry( 1993 年 8 月 ) 关 于 自动 切削 机 

的 研究 . 研究 中 采用 的 8 种 机 器 条 件 如 下 所 示 ， 


A 


LLL 
WARY GIAE 进 料 速度 
WRO 。 工 作 材料 。 (in) (3624588) (英寸 / 转 ) 





1 Ek 0.25 1250 0.011 
2 Bk 0.25 1 800 0. 005 
3 钢 0.25 3 750 0.003 
4 钢 0. 25 2 500 0.003 
5 钢 0.25 2 500 0. 008 
6 E 0. 125 4 000 0. 006 5 
7 钢 0. 125 4 000 0. 009 
8 钢 0. 125 3 000 0.010 


— ——,r I — —  — ` — 


假设 自动 系统 中 列 出 的 8 种 机 器 条 件 中 的 2 种 有 
缺陷 .了 定义 为 钢材 和 0. 25 in 钻 孔 三 个 机 械 条 件 中 
发 现 缺 陷 的 个 数 . 在 进行 试验 之 前 求 了 的 概率 分 
布 . (提示 : 列 出 所 有 可 能 发 现 缺陷 的 机 器 条 件 ，) 
9 接 针 的 抽样 验收 . 质量 控制 工程 师 从 生产 出 来 
的 一 大 批 撞 针 中 抽取 5 个 进行 检验 , 检验 员 不 知道 
5 个 中 有 3 个 缺陷 产品 . 工程 师 按照 随机 选择 顺序 
观测 5 个 撞 针 ,直到 发 现 一 个 有 缺陷 产品 (在 这 种 
情况 下 整 批 产 品 被 拒绝 ). 令 了 表示 质量 控制 工程 
师 必 须 检验 的 撞 针 数量 , 求 了 的 概率 分 布 并 作 图 . 


4A 


在 工程 和 科技 中 , 我 们 分 析 的 数据 通常 是 观测 一 个 过 程 得 到 的 . 例如 , 在 质量 控制 中 , 检测 一 个 
生产 过 程 并 记录 每 小 时 生产 的 缺陷 产品 数量 . 正如 前 面 所 提 到 的 ， 一 个 随机 变量 了 的 概率 分 布 就 是 
总 体 相 对 频率 分 布 的 模型 , 也 就 是 这 个 过 程 所 产生 的 数据 的 模型 所 以 , 我 们 可 以 用 数值 描述 性 度 
5, 例如 , 均值 和 标准 差 描述 整个 过 程 ,并 用 经 验 法 则 识别 Y 的 不 可 能 值 . 

随机 变量 了 的 期 望 值 (或 均值 ) 用 记号 E(Y) 表 示 , 具体 定义 如 下 ， 
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定义 4.4 设 了 是 一 个 离散 随机 变量 ,概率 分 布 为 p(y) ， 则 了 了 的 均值 或 期 望 值 是 ， 
u = E(Y) = 200 

参考 例 4. 1 的 掷 硬币 试验 和 表 4. 1 中 给 出 的 随机 变量 了 的 概率 分 布 , 说 明 E( Y) 的 公式 给 
出 离散 随机 变量 了 概率 分 布 的 均值 . 

E 假设 重复 例 4. 1 的 掷 硬币 试验 很 多 次 , 如 400 000 次 , 我 们 期 望 观测 到 大 约 有 100 000 次 没 
有 出 现 正面 , Y=0; 大 约 有 200 000 次 出 现 1 次 正面 , Y=1; 大 约 100 000 次 出 现 2 次 正面 , Y=2. 如 
果 计 算 这 400 000 个 了 值 的 平均 值 , 则 得 到 ， 

u~ Xy 100 000(0) +200 000(1) +100 000(2) 








n 400 000 
-0 100 000 +1 200 000 42 100 000 
i [ 400 000 ) [ 400 000 ) [ 400 000 | 





-*(1)(2)*2(2)9 Xo 

如 果 了 是 一 个 随机 变量 , 则 了 的 任何 一 个 函数 g( 也 是 随机 变量 . 8( 了 ) 的 期 望 值 定义 如 下 : 

定义 4.5 设 了 是 一 个 离散 随机 变量 , 概率 分 布 为 p(y), 又 设 g( 了 ) 是 了 的 一 个 函数 ， 则 g(Y) 
的 均值 或 期 望 值 是 : 

Elg(Y)] = 2 zO)p() 

离散 随机 变量 了 的 最 重要 函数 之 一 是 它 的 方差 Hn 了 与 其 均值 w 差 的 平方 的 期 望 值 . 

定义 4. 6 设 了 是 一 个 离散 随机 变量 ， 概率 分 布 为 表 4 3 Lo aga Y rx 
PpP(Y) ， 则 了 的 方差 是 : EUER 





c? -E[(Y-4)?] - E(Y)) - 击 等 级 了 p(y) 
Y 的 标准 差 是 了 的 方差 的 正平 方 根 : 1 0 
o - o 2 0. 0408 
参考 例 4. 2 NHTSA 司机 座 撞击 等 级 , 表 4.3 给 ; om 
出 了 每 辆 车 的 星 级 数 Y 的 概率 分 布 , 求 均值 和 标准 差 ; 0 1837 


解 ” 应 用 定义 4.5 和 定义 4.6 中 的 公式 , 我 们 得 出 ———————— ——— — 9189 — 
如 下 解 : f 
u = E(Y) = 2 p(y) = (1)(0) + (2)(0.0408) 
+(3)(0. 1735) + (4)(0. 6020) + (5)(0. 1837) =3. 93 


o? = E| (Y -1)?] = > (y - u)?pCy) 
-(1-3.93)?(0) * (2 -3. 93)? (0. 0408) 
+ (3 -3.93)? (0.1735) + (4 -3.93)?(0. 6020) 
* (5 -3.93)?(0. 1837) =0. 512 
og =~ o = 4/0. 512 -0. 715 
参考 例 4.4, 求 了 落 入 区 间 凡 + 20 的 概率 


100 $43 





解 由 例 4.4 我 们 知道 4=3.93, o 20.715, WKE u+ 2o 为 : 
p + 2g =3.93 + 2(0. 715) 23.93 +1.43 = (2. 50, 5. 36) . 
由 于 了 的 可 能 值 是 1,2,3,4 和 5. 注意 到 仅仅 值 3,4 和 5 落 入 该 区 间 内 , IA YAKE u t20 的 概 
de. 
p(3) * p(4) * p(5) 20.1735 +0. 6020 +0. 1837 20. 9592 
,也 就 是 说 ， 大约 有 95.990 的 星 级 在 2 5 -5.36 星之 间 . 显 表 44 估计 的 由 风 朴 散 时 间 的 概率 分 布 
R, 经 验 法 则 (第 2 章 用 于 描述 有 限 数据 集 的 变异 性 ) 提 —— — —— ———— 





。 ans RBK TR 概率 

TY 的 概率 分 布 散 布 性 或 变异 性 的 合适 描述 . (最 接近 的 时 间 ) š 
由 气象 与 土木 工程 工程 师 组 成 的 研究 小 组 , 针对 13 00: 
(87 TB SRI AES Ff RR Puk SU ERE EE 2 Hé HE ET T EAE. 14 0.25 
估计 花费 13 - 18 h 之 间 朴 散 低地 居民 的 概率 见 表 4. 4. 15 0.40 
a， 计 算 疏 散 时 间 的 均值 和 标准 差 . 16 0.18 

b， 你 期 望 疏 散 时 间 落 入 什么 时 间 范 围 内 ? 17 0. 10 

fa 18 0. 03 





a. E Y MIBCESCUEK UU ES rm BUE TH], 由 定义 4.4 和 定义 4.6, 我 们 计算 : 

u= E(Y) = > yp( y) 
=13(0.04) +14(0.25) +15(0.40) +16(0.18) +17(0.10) +18(0.03) 
=15.14h 

o? -EL(Y-4)?] = Y(y-u)2p(y) 
= (13 —15. 14)? (0.04) + (14 - 15. 14)? (0.25) + =- 

+ (18 -15. 14)? (0. 03) 

- 1.2404 


o - a! = 1.2404 21.10 h 
b. 根据 经 验 法 则 , 我 们 期 望 大 约 有 95% 的 朴 散 时 间 的 观测 值 落 人 六 +2c 内 ,其 中 
p. £20 = 15.14 +2(1-11) =15. 14 +2. 22 = (12.92, 17.36) 
因此 , RPMN F 12.92 ~ 17.36 h 之 间 . EFE 4.4 中 估计 的 概率 分 布 , 了 落 入 12.92 ~ 
17.36 之 间 的 真实 概率 是 : 
P(12.92z:Y 17.36) =p(13) +p(14) +p(15) +p(16) +p(17) 
=0. 04 +0.25 +0. 40 +0. 18 +0. 10 


=0.97 
经 验 法 则 再 次 为 随机 变量 Y 落 入 区 间 凡 +2o 内 的 概率 提供 了 好 的 近似 值 . 
应 用 练习 b. Ro. 
4.10 ”控制 水 靖 芦 . 参考 练习 4 1 的 水 葫芦 时 片上 c. 求 x* 落 入 区 间 人 + 上 2cr 的 精确 概率 ， 比 较 切 比 雪 
飞 剧 卵 数量 的 概率 分 布 , 求 此 概率 分 布 的 均值 , 并 夫 法 则 和 经 验 法 则 . 
解释 这 个 值 . 4.12 本 福 德 的 数字 规律 . 参考 练习 3. 8, American 
4.11. Eit AUR. 练习 4.2 给 出 高 尘 螨 水 平家 庭 Scientist 1998 年 7 -8 月 ) 关 于 一 个 随机 选取 的 数 
数量 了 的 概率 分 布 . 的 第 一 位 有 效 数字 最 有 可 能 出 现 哪个 整数 的 研究 . 


a. 求 E(Y) ,对 此 结果 给 出 有 意义 的 解释 . 每 个 整数 作为 6 位 随机 数 的 第 一 位 的 频率 见 下 表 : 
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~ " b 计算 每 个 电弧 的 e 并 解释 此 值 . 
BET REAREA AEFT REHE i 掌握 计算 机 程序 . 在 掌握 一 个 复杂 的 计算 机 软 
1 109 6 117 件 程 序 前 , 必须 经 过 的 培训 单元 个 数 从 1 变化 到 
2 75 7 89 5, 它 取决 于 学 生 . 积累 了 大 量 经 验 之 后 ,软件 制造 
3 T 8 62 商 确定 了 一 个 概率 分 布 , 它 表 述 了 每 个 培训 单元 
4 99 9 43 后 用 户 掌 握 软 件 的 比例 . 
5 72 合计 743 单元 个 数 掌握 的 概率 
a 写 出 第 一 位 有 效 数字 了 的 概率 分 布 . ! 91 
b. ok EY). 2 0.25 
c， 如 果 可 能 , 给 出 ECY) 一 个 符合 实际 的 解释 . 3 0.4 
4.13 RR SLE REI. 参考 例 4.6, 表 4.4 25 H T R 4 0.15 
5 0.1 


风 到 来 时 疏散 时 间 的 概率 分 布 . 天 气 预报 专家 表 
AR, 他 们 不 能 提前 14 h 准确 地 预测 飓风 将 要 登陆 . 
如 果 海 湾 沿 岸 土木 工程 署 一 直 等 到 牙 散 前 14 h 3 
JR, 所 有 居住 在 低地 的 居民 安全 朴 散 ( 即 飓 风 到 达 
沿岸 之 前 ) 的 概率 是 多 少 ? 





a 计算 掌握 程序 所 必须 的 培训 次 数 的 均值 . 计算 
中 位 数 , 并 解释 它们 . 

b、 如 果 公司 希望 保证 至 少 有 75% 的 学 生 掌 握 程 
F, 必须 的 最 少 培训 单元 数 是 多 少 ? MRED 

BEREI GEMAN) Hox 90% Wi? 

c. 假设 公司 制定 了 新 的 培训 计划 , 仅仅 需 一 次 








13 0. 04 培训 , 掌握 的 概率 从 0.1 增加 到 0. 25， 只 需 
14 0.25 两 个 单元 培训 的 概率 增加 到 0.35， 留 给 需要 
15 0.40 三 个 单元 培训 的 概率 是 0.4, 完全 不 需要 4 个 
16 0. 18 和 5 个 培训 单元 , 对 这 个 新 的 计划 你 如 何 回 
17 0.10 答 a 和 b? 

18 0.03 4.16 撞 针 的 抽样 验收 . 参考 练习 4. 9, 假设 检测 一 





Hf SERE SEE 200 美元 . 

4.14 桥接 网 络 的 可 靠 性 , 练习 4.7 给 出 了 有 6 个 电 a. 检测 这 批 撞 针 的 期 望 费 用 是 多 少 钱 ? 
弧 的 容量 -流量 网 络 ( Networks, 1995 年 5 H), 参考 b. 方差 是 多 少 ? 
6 个 电弧 电容 量 的 概率 分 布 . c. 你 期 望 检测 费用 落 在 什么 范围 内 ? 
a 计算 每 个 电弧 电容 量 的 均值 并 解释 此 值 . 


4.4 一 些 有 用 的 期 望 值 定理 


现在 我 们 给 出 三 个 定理 ， 这 三 个 定理 在 求 随机 变量 函数 的 期 望 值 时 非常 有 用 , 我 们 将 定理 的 证 
明 留 给 读者 作为 理论 练习 . 
定理 4. 1 设 了 是 一 个 离散 随机 变量 ,概率 分 布 为 P(Y),c 是 一 个 常数 , MJ c 的 期 望 值 (或 均 
值 ) 是 : 
E(c) =c 
定理 4.2 设 了 是 一 个 离散 随机 变量 ,概率 分 布 为 P(Y), c 是 一 个 常数 ， 则 cY 的 期 望 值 ( 或 均 
值 ) 是 : 
E(cY) =cE( Y) 
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定理 4. 3 
EE. 那么 


设 了 是 一 个 离散 随机 变量 ， 概率 分 布 为 p(y) , 4 gi (Y), ga (Y) 2U', gu, (Y) 了 的 


El g, (Y) +g2(Y) +- +g,(Y)] -Elg(Y)] *E[g;(Y)] + * Eg, CY)] 
由 定理 4.1 ~4.3 可 以 得 出 计算 随机 变量 方差 的 简单 公式 , 见 定理 4. 4. 


定理 4.4 g?^-E(Y))-yQ. 


定理 4. 4 的 证 了 明 


由 定义 4. 6, RIA o? 的 如 下 表达 式 : 


o° -E[ (Y-u)?] =E(¥ -2u Y +p?) 


应 用 定理 4.3 得 ， 


a? =E(Y) +E( -2u Y) « E(g?)) 


现在 我 们 应 用 定理 4. 1 和 定理 4.2 得 


a? S E(Y?) -2u E(Y) +p? -E(Y) —2n(u) +u? 


-E(Y2) -2,2 tu? 
-EQY)- 


在 下 面 的 章节 中 , 我 们 将 用 定理 4. A 求 出 某 些 离散 随机 变量 的 方差 , 方法 见 例 4.7. 
用 定理 4.4 求 例 4. 1 中 随机 变量 Y 的 方差 

解 在 例 4.4 HO, REAR o? -E[(Y-4)?], 我们 直接 求 NHTSA 中 每 辆 车 的 星 级 数 了 的 方 
差 . 因为 这 样 求 可 能 是 一 个 麻烦 的 过 程 , 求 出 B( 丈 ) 常 常 是 容易 的 , 然后 用 定理 4 4 计算 22. 例如 ， 


EQ?) = X pO) = 0 (1)« co*(2)« (1) 1.5 


Hi -1CBI 4.3 结果 ) 代 入 定理 4.4 中 的 j, 我们 得 


o? = E(Y2) -y21.5- (1)? 20.5 


显然 , 这 是 我 们 在 例 4. 4 中 得 到 的 o? 值 . 


在 4.6 ~4.10 节 中 , 我 们 将 给 出 一 些 有 用 的 离散 概率 分 布 模型 . 同时 , 不 加 证 明 地 给 出 每 个 模型 
的 均值 、 方 差 和 标准 差 . 这 些 量 中 的 一 部 分 在 选 做 的 例题 中 求 得 , 其 余 的 留 作 选 做 的 练习 . 


应 用 练习 

4.17 宇 螨 性 过 敏 症 . 参考 练习 4.2 和 4. 11, 尘 螨 
含量 超过 2 pg/g 的 每 个 家 庭 将 花费 2 000 美元 
购买 过 敏 空 气 净 化 系统 , 求 4 个 抽样 家 庭 消 费 
总 额 的 均值 和 方差 , 并 给 出 消费 总 额 可 能 落 人 
的 区 间 . 

4.18 海滩 侵蚀 热 区 . 利用 定理 4.4 计 算 练习 4.4 的 
概率 分 布 的 方差 并 解释 此 结果 . 

4.19 本 福 德 的 数字 规律 . 利用 定理 4.4 计算 练习 
4. 12 概率 分 布 的 方差 , 验证 你 的 结果 与 练习 4. 12 
的 结果 一 致 . 

4.90 撞 针 的 抽样 验收 . 参考 练习 4.9, Hip y 是 从 





一 大 批 产品 中 选 出 的 一 个 容量 为 5 的 撞 针 样本 中 
检测 的 撞 针 个 数 . 假设 一 个 有 缺陷 产品 的 检测 费 是 
300 美元 , 否则 是 100 美元 , 那么 总 的 检测 费用 是 
C( 美 元 ) ,由 方程 C = 200 + 100y 给 出 , R C 的 均 
值 与 方差 . 


理论 练习 
4.21 ”证 明定 理 4. 1. (提示 ; 利用 20) = 1. ) 


4.22 证 明定 理 4.2. (提示 : 用 定义 4.5 直接 证 
Hj. ) 


4.23 证 明定 理 4. 3. 


O 译 者 注 ; 实际 上 , BU 4. 4 是 求 例 4.2 NHTSA 的 方差 , 而 不 是 求 例 4. 1 RAREN. 
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4.5 伯 努 利 试验 


本 章 讨论 的 几 个 离散 概率 分 布 是 基于 -系列 称 为 伯 努 利 试验 的 试验 或 过 程 | 

一 次 伯 努 利 试验 得 到 两 个 互 扩 的 结果 之 一 ， 一 般 用 S( 成功 ) 和 FF( 失败) 表示. 例如 , 投掷 一 
枚 硬币 是 伯 努 利 试 验 ， 因为 只 可 能 有 正 (H) 或 反 (T) 两 个 不 同 的 结果 之 一 出 现 . 伯 努 利 试验 的 特 
征 见 下 面 框 格 . 





伯 努 利 试验 的 特征 
1. 试验 得 到 两 个 互 斥 的 结果 之 一 . (我 们 用 5 表示 一 个 结果 , 用 已 表示 另 一 个 结果 , ) 
2. 两 个 结果 是 完备 的 ， 即 不 可 能 有 其 他 结果 . 
3. S$ 和 下 概率 分 别 用 己 和 9 表示 , 即 PCS) =p, P(F) =9 注意 , p+q=1. 








伯 努 利 随 机 变量 了 定义 为 伯 努 利 试验 的 数字 结果 , 其 中 , 若 出 表 4.5 伯 努 利 概率 分 布 
现成 功 记 了 = 1; 若 出 现 失败 记 了 = 0. 因此 , Y = y 的 概率 分 布 见 结 om Y=y p(y) 


=E 4.5. P 0 4 








伯 努 利 概率 分 布 
考虑 一 个 伯 努 利 试验 ， 其 中 : 
-位 如 果 出 现成 功 (3) 
0, 如 果 出 现 失败 (下 ) 
伯 努 利 随机 变量 了 的 概率 分 布 是 : 
p(y) pq" (y=0, 1) 
其 中 : 
P = 18 X RAN y y A R 
l q=1-p 
伯 努 利 随 机 变量 的 均值 和 方差 分 别 是 : 








p 7 pfi o? =pq 





TESEBE IB AMBAE RUDI rp, 定义 日 为 成 功 , T 为 失败 . EISE H BEY S1; 出 现 T 时 了 =0. 如 
果 硬 币 是 均匀 的 , 由 P(H) = PCT) 20.5 可 知 了 的 概率 分 布 是 : 
p(1) =p=0.5 
p(0) 2420.5 
GRAA 证明: 伯 努 利 随机 变量 了 的 均值 =p, 标准 差 0 = Vpg. 
解 ”我们 知道 PY=1) =p(1) =p, P(Y=0) =p(0) =q, 则 由 定义 4.4 知 ， 
u =E(Y) 2 Xyp(y) = (1)p(1) + (0)p(0) 
=p(1) =p 
同时 , 由 定义 4.5 和 定理 4.4 得 ， 
o? -E(Y) - 2 = Y, 2p(y) -p= (1)2p(1) +(0)2p(0) - 2 
=p(1) -x° - p- p? =p(1 ~p) =pq 
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因此 , o =Ve2 = /pq. 
在 工程 和 科学 应 用 中 , 伯 努 利 随 机 变量 本 身 并 没有 多 大 意义 . 然而 , 一 系列 的 伯 努 利 试验 会 导 
致 一 些 著名 且 常 用 的 离散 概率 分 布 , 其 中 之 一 在 下 一 节 阅 述 . 


4.6 二 项 概率 分 布 * 


,现实 生活 中 的 许多 试验 是 一 系列 的 伯 努 利 试验 , 2I ALT REED HA 5 BURG n W. 假设 为 
城市 提供 饮用 水 的 私 用 井中 有 30% 含 杂质 A, 那么 随机 选取 10 口 井 并 进行 杂质 A 的 测试 类 似 于 掷 
一 枚 不 均匀 的 硬币 10 次 , 每 次 试验 出 现 正面 (发 现 杂质 A) 的 概率 为 0. 30. 公众 意见 或 消费 者 偏好 民 
意 测验 得 到 两 种 反应 之 一 ( 是 或 否 , 赞成 或 不 赞成 , 等 等 ) 如果 总 体 的 很 大 , BEERE n 相对 小 ， 
比如 说 0.10 NREN, 也 类 似 于 掷 一 枚 不 均匀 的 硬币 试验 . 所 有 这 些 试验 都 是 二 项 试验 的 实际 例 
T. 这 些 试验 以 及 得 到 的 二 项 随机 变量 所 具备 的 特征 见 下 面 方 框 . 





定义 二 项 随机 变量 的 特征 
试验 包含 次 相同 的 伯 努 利 试验 . 
每 次 试验 只 有 两 种 可 能 结果 : SOR) FOR). 
:每 次 试验 保持 P(S) =p, PCF) =q 相同 . (注意 p +q = 1). 
On GRIS E dr WW. 
.二 项 随机 变量 了 表示 普 次 试验 中 成 功 的 次 数 . 








A + O N” 一 





在 下 面 框 格 中 给 出 了 二 项 概率 分 布 的 均值 和 方差 . 图 4. 4 给 出 了 样本 容量 n=10 时 , 不 同 p 值 所 

对 应 的 二 项 分 布 相对 频率 直方 图 . 注意 到 p 值 小 时 概率 分 布 向 右 偏 , p 值 大 时 概率 分 布 向 左 偏 ， 

p =0, 5 时 对 称 
p 











pO) p) 
0.4 0.4 0.4 
0.3 0.3 0.3 — 
0.2 0.2L 02L 
0.1 0.1 0.1 
EXER Bed, y y 
0123456782910 012345678910 G t Z 3 4 5.-6.7.8.9.]10 
a) p=0.1 b) p=0.3 c) p=0.5 
RE p(y) 
04 [- o4 L 
0.3 - 0.3 - 
0.2 - 02L 
0.1 - 03 上 
P = y 
012345678910 012345678910 
d) p=0.7 e) p-09 


图 4.4 当 n=10, p-0.1,0.3, 0.5, 0.7, 0.9 时 的 伯 努 利 概率 分 布 
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二 项 概率 分 布 
二 项 随机 变量 了 的 概率 分 布 是 : 


- n y ny = 2. .…- n 
p(y) (yj (y=0, 1,2, =, n) 
EP, ps AGCRIERGEIMGR: 9 =1 -ps n = 试验 的 次 数 ; y =n e Robots (7) = 


| y) yt(n y) 
二 项 随机 变量 的 均值 和 方差 分 别 是 : 
p -np, o° = npq 











二 项 概率 分 布 导出 如 下 : 对 n 重 伯 努 利 试验 组 成 的 二 项 试验 的 简单 事件 可 以 用 符号 SFSFFFSSS 
F--SFS 表示 , 其 中 , 从 左 往 右 的 第 i 个 位 置 上 的 字母 表示 第 i 次 试验 的 结果 . 由 于 我 们 想 求 出 次 斌 
验 中 成 功 y 次 的 概率 p(y) , 因此 必须 将 所 有 成 功 (S)y KIRKE) (n. - y) 次 的 简单 事件 的 概率 求 
和 . 这 些 简单 事件 用 符号 表示 为 

— 9 

SSSS. S FF... F 
或 这 些 符号 的 其 他 不 同 排列 . 

由 于 试验 是 相互 独立 的 , 一 个 包含 y 次 成 功 的 特殊 简单 事件 概率 是 ， 
y (n-y) 
P(SSS-8 FFF) 2p? 

这 些 等 概率 的 简单 事件 的 数量 相应 于 次 试验 的 个 位 置 中 安排 y 个 S 和 (ny) 个 下 时 方法 的 个 
JC 这 等 于 从 nt 个 位 置 中 为 y 个 S 选 出 y 个 位 置 (试验 ) 的 方法 总 数 . 由 定理 3.4 知 , 这 个 数 是 





n n! 
[;) “yl(n-y)! 
我 们 已 经 得 到 了 每 个 成 功 y 次 的 简单 事件 概率 以 及 这 种 简单 事件 的 个 数 . 现在 我 们 求 出 这 些 简 
单 事件 的 概率 之 和 得 到 
p(y) = (成 功 y 次 的 简单 事件 个 数 ) x (这 些 等 概率 的 简单 事件 之 一 的 概率 ) 
或 者 


p(y) = [,) 


电子 工程 师 意 识 到 计算 机 电力 系统 中 的 高 的 中 性 电流 是 一 个 潜在 问题 . 最 近 一 次 在 美国 进 
行 的 计算 机 电力 系统 负荷 电流 的 调查 发 现 , 10% 的 站 点 有 高 的 中 性 电流 对 满载 电流 比 (EEE Transac- 
tion on Industry Applications , 1990 年 7/8 月 ). 如 果 从 全 国 的 大 量 站 点 中 选 出 5 个 站 点 计算 机 电力 系统 
作为 一 个 随机 样本 , 求 下 面 的 概率 . 

a. 恰 有 3 个 站 点 有 高 的 中 性 对 满载 电流 比 ? 

b. 至 少 有 3 个 站 点 ? 

c. Z 3 个 站 点 ? 

解 第 一 步 要 明确 这 个 试验 具有 二 项 试验 的 特征 , 这 个 试验 由 n=5 次 伯 努 利 试验 组 成 每 次 相 
应 于 随机 挑选 一 个 站 点 , 每 次 试验 结果 是 成 功 S( 这 个 站 点 的 计算 机 电力 系统 有 高 的 中 性 对 满载 电流 
比 ) 或 失败 F( 系 统 没有 高 的 中 性 对 满载 电流 比 ). 由 于 全 国 计 算 机 电力 系统 的 站 点 很 多 , 选 出 一 个 站 
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点 且 发 现 有 高 的 中 性 对 满载 电流 比 的 概率 为 0. 1,， 这 个 概率 值 对 选 出 来 的 5 个 站 点 中 的 每 个 是 大 致 
相同 的 (从 实际 效果 ). 况且 由 于 抽样 是 随机 的 , 我 们 假定 任何 一 个 站 点 的 结果 不 受 其 他 站 点 结果 的 
影响 , 即 试验 是 独立 的 . 最 后 , 我 们 感 兴 趣 的 是 在 n=5 的 样本 中 ， 有 高 的 中 性 对 满载 电流 比 站 点 的 
数量 了 , 从 而 抽样 过 程 代表 一 个 n=5 和 p =0.1 的 二 项 试验 . 
a. 恰好 有 了 =3 个 高 比率 站 点 的 概率 ， 
n n- 
p(y) = (^s T 
其 中 n=5, p=0.1, H y=3, 因此 
p(3) =3 (0. 1)3(0.9)2 =0. 0081 
b. 至 少 三 个 站 点 有 高 比率 的 概率 ; 
P(Y>3) =p(3) +p(4) +p(5) 
其 中 
p(4) =ar ir 1)*(0. 9)! =0. 000 45 


_ 35! 5 0 _ 
p(5) 751 or D (0. 959 20. 00001 


由 于 在 a 中 我 们 已 求 出 了 p(3), RIA: 
P(Y23) =p(3) +p(4) +p(5) =0. 0081 +0. 000 45 +0. 000 01 =0. 008 56 


c. FER P(Y«3) =p(0) +p(1) +p(2), 但 是 我 们 可 以 利用 补 关系 以 及 Y») = = 1 的 事实 , 不 
必 计 算 这 些 概 率 . 因此 ， 
P(y«3) =1 - P(yz 3) =1 -0.008 56 =0. 991 44 
3& B.2 给 出 了 n=5, 10, 15, 20 和 25 一 项 概率 形 如 


o0) 


的 部 分 和 ( 称 为 累积 二 项 概率 ) 的 表 . 例如 在 n=5 的 表 中 ,对 应 着 =2 的 行 与 p =0.1 列 的 部 分 和 ， 
可 以 求 出 部 分 和 为 : 


Xo = = p(0) +p(1) + p(2) = 0.991 
精确 到 三 位 小 数 ， 这 个 答案 与 例 4 9 h 的 答案 是 一 致 的 . 
LEER 求 n=20 和 p=0.6 的 二 项 随机 变量 的 均值 、 方差 和 标准 差 , 构造 凡 +2c 区 间 , 并 计 
算 P(j -20 <Y «pu +20). 
解 ” 应 用 前 面 给 出 的 公式 , RIE: 

KL=np=20(0.6) =12 

c? =npq =20(0. 6) (0.4) =4.8 

T= /4.8 =2. 19 
图 4.5 显示 了 n=20， P=0.6 及 区 间 j+20, 或 (7.62, 16. 38) 的 二 项 概率 分 布 . 落 入 区间 w+2c( 加 
黑 部 分 ) 的 了 值 是 8, 9, …, 16. 从 而 
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p(y) 


0.20 


0.15 


0.10 


0.05 [- 
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图 4.5 454.10 中 了 的 伯 努 利 概率 分 布 (=20, p 20.6) 


P(u-2o <Y <p+20) = P(y =8,9,10, =, 16) = $o) 3 Y st) 
由 表 B. 2 我 们 得 到 部 分 和 的 值 g 
P(u -20 «Y «p +20) = Sa ` Y s) = 0.984 — 0.021 = 0. 963 
可 以 看 到 ,这 个 结果 与 第 2 章 讨论 过 的 经 验 法 则 给 出 的 值 0. 05 很 接近 
导出 二 项 随机 变量 了 的 期 望 值 公式 . 
解 ” 由 定义 4.4， 


Š ! 
= E(Y = ( ) = — Et S hay 
P ) = AO = Er us prt 


求 这 些 项 之 和 的 最 简单 的 办 法 就 是 将 它们 换 成 一 项 概率 , 然后 利用 Y») = 1 的 事实 . 注意 , MR 
的 第 一 项 等 于 0( 因 为 了 =0) , 我 们 有 : 


= n! " 
pes 2 Ty -1)—3-2-1]0 59314 Í 





Š n! i= 
= È Goa p 
因为 n 和 p 是 常数 ,我 们 利用 定理 4.2 从 和 中 提出 因子 np, 


- - (n - 1)! -l n- 
de "mw rly kii 


$ Z-(OY-1), 则 当 Y=1 时 , Z=0; 当 Y=n 时 , Z=(n-1), 于 是 














108 第 4 章 
` n -1)! PM 
H= "p (y Y DP lg y 
v. (n-D! pana 
= np > aD -qp* 1) 
求 和 号 中 的 量 是 p(z), 其 中 2Z 是 基于 ( n -1) 重 伯 努 利 试验 的 二 项 随机 变量 ， 从 而 
| Y») -1 
B u mp Y pC) = np(l) - np 
应 用 练习 能 推断 出 什么 ?为 什么 ? 


4.24 生态 病毒 学 生存 研究 . 在 Journal of Agricultur- 


al, Biological and Environmental Science (2000 年 9 
H), 研究 人 员 应 用 生态 病毒 学 生存 模型 评估 危险 
污染 物 造 成 的 风险 . 一 个 试验 是 把 20 条 孔雀 鱼 ( 相 
同 的 年 龄 和 大 小 ) 放 到 被 狄 氏 杀 虫 剂 污染 的 天 然 海 
水 池 中 , 我 们 关心 的 是 5 天 后 幸存 的 孔 淮 鱼 数量 
Y, 研究 人 员 估 计 任 何 一 条 和 孔 淮 鱼 生 存 的 概率 
是 0. 6. 

a 证 明了 服从 二 项 概率 分 布 , p 值 是 多 少 ? 

b. 求 Y=7 的 概率 . 

c. REDA 10 条 孔雀 鱼 生存 的 概率 . 

-25 瓶装 水 的 分 析 . 你 喝 的 瓶装 水 真 的 是 纯净 水 
23? 自然 资源 保护 协会 对 不 同 品牌 的 瓶装 水 进行 
了 4 年 的 研究 , 发 现 25% 的 瓶装 水 仅仅 是 往 瓶 子 
里 装 人 自 来 水 ( Scientific American, 2003 4E. 7 H). 
考虑 由 5 种 品牌 瓶装 水 组 成 的 一 个 样本 , 令 了 等 于 
这 些 品牌 中 使 用 了 自来水 的 个 数 . 

a 用 式 子 给 出 了 的 概率 分 布 . 
b. s& P( 了 =2). 
c. 求 P(Y«1). 

.26 桥梁 等 级 鉴定 . 根据 国家 桥梁 检验 标准 
(NBIS) , 长 度 超过 20 ft 的 公共 桥梁 必须 每 两 年 进 
行 一 次 鉴定 评级 . NBIS 等 级 范围 从 0( 最 低 一 级 ) 
到 9( 最 高 一 级 ). 科罗拉多 大 学 的 工程 师 们 用 一 个 
概率 模型 预测 丹佛 所 有 主要 桥梁 的 鉴定 等 级 . 
( Journal of Performance of Constructed Facilities, 2005 
年 2 H. ) 工 程 师 们 预测 到 2020 F, 丹佛 全 部 主要 
桥梁 的 9% 将 小 于 等 于 4 级 . 

. a. 利用 预测 求 2020 年 在 10 座 主 要 桥梁 的 随机 样 

本 中 , 至 少 3 座 鉴定 等 级 小 于 等 于 4 的 概率 . 

b. 假定 在 2020 年 , 你 实际 看 到 在 10 座 桥 梁 的 样 

本 中 有 3 个 或 更 多 个 的 鉴定 等 级 小 于 等 于 4, 你 


4. 


+ 


> 


27 检查 计算 机 病毒 . Chance (2004 ER) 发 现 了 
检查 网 络 计算 机 上 病毒 ( 如 木马 程序 或 蠕虫 ) 的 基 
本 方法 . 这 些 病毒 通过 被 识别 为 一 个 包 的 通信 请 求 
(如 电子 邮件 、 聊 天 室 、 远 程 登 录 ) 到 达 网 络 . 例 
An, "SYN 洪水 "病毒 是 通过 多 包 使 网 络 计算 机 处 
于 停顿 . 如 果 网 络 探测 器 观测 到 至 少 一 个 包 , 电子 
安全 专家 就 可 以 发 现 这 种 类 型 的 病毒 侵袭. 假设 观 
测 到 由 某 种 新 病毒 发 送 包 的 概率 只 有 0.001. 如 果 
病毒 实际 上 向 网 络 计算 机 发 送 150 个 包 , 病毒 被 探 
测 器 发 现 的 概率 是 多 少 ? 


.28 山 毛 样 树林 中 的 真菌 . 参考 练习 3.7，4pplied 


Ecology and Environmental Research (2003 年 第 1 3) 

关于 山 毛 样 树林 被 真菌 损害 的 研究 . 研究 人 员 发 

现 , 在 欧洲 的 中 东部 地 区 有 25% 的 山 毛 样 树 被 真 

ARET. 考虑 从 这 一 地 区 抽出 20 棵 山 毛 样 树 组 

成 的 一 个 样本 . 

a 有 不 到 一 半 的 山 毛 样 被 真菌 损害 的 概率 是 
多 少 ? 

b. 超过 15 棵 山 毛 样 被 真菌 损害 的 概率 是 多 少 ? 

c. 你 期 望 抽样 的 20 棵 树 中 有 多 少 棵 被 真菌 损 
害 了 ? 

29 排泄 物 污染 的 鸡肉 . 美国 农业 部 (USDA) 报告 

显示 , 在 它 的 标准 检查 系统 中 , 每 100 只 屠宰 的 鸡 

经 过 检查 有 1 只 被 排泄 物 污染 . ( Tampa Tribune, 

2000 年 3 月 31 H. ) 在 练习 3. 6 rh, 求 出 了 随机 取 

出 一 只 被 宰 的 鸡 经 过 检查 含有 排泄 物 污染 的 概率 ， 

现在 求 在 5 只 被 宝鸡 的 随机 样本 中 , 经 过 检查 至 少 

有 1 只 排泄 物 污染 的 概率 . 


-30 工程 学 博士 . 国家 科学 基金 报道 , 在 美国 获得 


工程 学 博士 学 位 的 研究 生 中 70% 是 外 国人 ,考虑 
刚刚 获得 工程 学 博士 学 位 的 25 名 学 生 组 成 的 一 个 
随机 样本 中 外 国学 生 的 人 数 工 l 

a. 3R P(Y 210). 
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b. 3k P(Y=5). 

c. 求 了 的 均值 人 K 和 标准 差 o. 

d. 解释 c 中 的 结果 . 

4.31 砌 墙 工 的 性 别 . Occupational Outlook Quarterly 

(1993 年 春 ) 报 道 建筑 工业 雇 的 砌 墙 工 中 , 有 1% 

是 女性 . 在 10 个 砌 墙 工 组 成 的 随机 样本 中 , 求 至 

多 有 1 个 女性 的 概率 . 

32 未 结 运 货 单 档案 . 工业 物流 信息 系统 的 趋势 研 

究 发 现 , 在 交通 运输 方面 , 计算 机 发 挥 了 最 大 的 优 

3i ( Industrial Engineering, 1990 年 7 月 ). 假定 99% 

的 产业 在 它们 的 计算 机 数据 库 中 有 未 结 的 运 货 单 

档案 , 在 10 个 产业 组 成 的 随机 样本 中 , 令 了 等 于 

它们 的 计算 机 数据 库 中 有 未 结 运 货 单 档案 的 产业 

数量 . 

a. 证 明 : 了 的 概率 分 布 可 以 用 二 项 分 布 建 模 . 

b. 求 P(Y=7). 

c. 3K P(Y>5). 

d. 求 了 的 均值 和 方差 , 解释 结果 . 

433 无 人 监控 系统 . 参考 练习 3.25, IEEE Computer 
Applications in Power 有 关 为 发 现 交 人 者 而 设计 的 户 
外 无 人 监控 系统 的 研究 . FER, 10 LAG XS AE 
能 发 现 7 个 , 因此 研究 人 员 估计 下 雪 天 系统 发 现 交 
人 者 的 概率 为 0.70. 

a. 假设 下 雪 天 发 现 冯 人 者 的 概率 只 有 0.50, 求 对 
10 个 奖 入 者 无 人 监控 系统 至 少 发 现 7 人 的 
概率 . 

b. 根据 a 中 的 结论 , 评价 研究 人 员 对 下 雪 时 系统 
发 现 奖 人 者 概率 的 估计 的 可 靠 性 . 

4.34 ”中 性 粒子 的 反射 . 参考 练习 3. 36, 中 性 粒子 运 
动 问题 . 回想 释放 进入 真空 管道 后 的 粒子 与 内 壁 碰 
撞 , 要 么 以 0. 16 的 概率 散射 (反射 ), 要 么 以 0. 84 
的 概率 被 吸收 (Nuclear Science and Engineering, 
1986 年 5 月 ). 

a. 如果 有 4 个 粒子 进入 管道 , 所 有 4 个 粒子 全 部 
被 管道 内 壁 吸收 的 概率 是 多 少 ? 4 个 粒子 中 恰 


>= 


4.7 多 项 概率 分 布 


有 3 个 被 吸收 的 概率 是 多 少 ? 

b WRA 20 个 粒子 进入 管道 , 至 少 有 10 个 粒子 
被 管道 内 壁 反射 的 概率 是 多 少 ? WA 10 个 被 反 
射 的 概率 是 多 少 ? 

.35 $085 X IN. Ataxia-telangiectasia( A-T) 是 造 
成 免疫 系统 的 神经 春 乱 而 导致 早熟 的 基因 . 根据 
Science News( 1995 年 6 月 24 日 )， 当 夫妻 两 人 都 
携带 A-T 基因 时 , 他 们 的 后 代 感 染 这 种 疾病 的 机 
会 是 1⁄5. 

a. 考虑 15 对 两 人 同时 携带 A-T 基因 的 夫妻 ，15 对 
中 超过 8 对 夫妻 有 神经 紊乱 孩子 的 概率 是 多 少 ? 

b. 考虑 10 000 对 两 人 都 携带 A-T 基因 的 夫妻 , 是 
否 可 能 有 不 到 3 000 对 夫妻 有 这 种 病 的 孩子 ? 


理论 练习 
4. 36 ”对 二 项 概率 分 布 P(y), EM: Y p) = 1 
(提示 : 有 关 (a +b)" 展开 式 的 二 项 式 定理 给 出 


(a+b)"= (oj «(ne 
+ [x] Le [ M 
4 a=q, b=p). 


4.37 ”对 二 项 随机 变量 , EH: 
E[Y(Y -1)] =npg + -p 
(提示 : 将 期 望 值 写 成 一 个 和 和 式 , 消去 y(y -1), 然 
后 分 解 , 直到 和 式 中 的 每 一 项 是 二 项 概率 , 利用 
Y p(y) = 1 求 和 . ) 
4.38 ”对 二 项 随机 变量 , 利用 练习 4.37 的 结论 及 
E[Y(Y-1)] =E(Y¥Y - Y) 
=E(Y)-E(Y) =E(Y ) -u 


+ 


REY). 
4.39 对 二 项 随机 变量 , 利用 练习 4.37 和 练习 4.38 
结论 以 及 定理 4.4, 证 明 o? = npq. 


许多 类 型 的 试验 得 到 的 是 多 于 两 个 可 能 结果 的 定性 变量 的 观测 . 例如 私人 水 上 飞机 发 动机 
的 火花 塞 是 由 5 条 不 同 生产 线 A、B、C、D、E 中 的 某 条 生产 线 生产 的 , 为 了 比较 5 条 生产 线 上 
有 缺陷 火花 塞 的 比例 , 质量 控制 工程 师 每 天 要 把 所 有 的 缺陷 火花 塞 按照 不 同 生 产 线 进 行 分 类 ， 
每 个 火花 塞 是 一 个 试验 单位 ,观察 值 是 识别 火花 塞 由 哪 条 生产 线 生 产 的 字母 ,显然 生产 线 是 定 


性 变量 . 
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假设 某 个 星期 内 共 发 现 n=103 个 火花 塞 是 缺陷 品 , n = 103 个 定性 观测 值 , 每 个 结果 是 A、B、 
C. D, E HUE 5 条 生产 线 的 缺陷 品 个 数 . 例如 ,Yi 215 个 A, Y, 227 个 B, =31 个 C, Y, =19 4 
D, Ys - 11 FE, 分 类 数据 如 表 4. 6 所 示 , 给 出 了 每 个 类 型 的 个 数 . 注意 , 5 条 生产 线 生产 的 缺陷 品 个 
数 之 和 必须 等 于 总 的 缺陷 品 个 数 : 

n=Y +Y; +Y, +Y, +Y; =15 +27 431 +19 +11 =103 

我 们 刚才 描述 的 分 类 试验 称 作 多 项 试验 , 是 4 6 节 讨 论 的 二 项 4e i P 
试验 的 推广 . 这 类 试验 由 n 次 相同 的 试验 组 成 ， Bl n 个 试验 单位 的 火花 塞 按 生 产 线 的 分 类 
观测 ,每 次 试验 所 得 是 且 只 能 是 种 结果 ,% 个 分 类 类 型 之 一 (对 一 项 
试验 =2). 一 次 试验 结果 落 人 第 i 种 类 型 的 概率 是 p (i =1， 2, ---, 
4) ,试验 是 独立 的 , 我 们 关心 的 是 观测 值 落 入 上 种 分 类 类 型 的 个 数 


生产 线 














Yi, Yo, e, Y, 
多 项 试验 的 性 质 
1. 试验 由 于 次 相同 的 试验 组 成 
2. 每 次 试验 有 上 个 可 能 结果 . . 
3. k ERRERA p, p, s p 表示 ， 在 每 次 试验 中 保持 不 变 , 其 中 p tpt tp, = 1. 
4. 试验 是 独立 的 . 
5S 关心 的 随机 变量 是 大 个 分 类 类 型 中 每 一 个 的 记 数 Y. Yy, s Y, 








下 面 的 方 框 给 出 了 多 项 分 布 及 其 均值 和 方差 





多 项 概率 分 布 


LL)” (p) po" 
其 中 , Pi = 一 次 试验 出 现 结果 i 的 概率 ; p + ps +… *tp,clinzy +y + +y, = 试验 的 次 数 ; y, =n 
次 试验 中 出 现 结果 i 的 次 数 . 

多 项 随机 变量 了 的 均值 和 方差 分 别 是 : 


pa = np, 和 c; =np,(1 -p;) 


PC Yn. rs. y) = 

















导出 类 型 个 数 y, ys, on, ys 的 多 项 概率 分 布 p(y1,y,，…, y) 的 过 程 与 用 于 二 项 试验 的 过 程 
相同 . 为 了 简化 记号 , 我 们 以 左 =3 个 类 型 为 例 进行 说 明 , 个 类 型 表 4.7 多 项 试验 (k3) 
的 p(yi， yo, `", yi) 的 推导 是 类 似 的 . 的 典型 简单 事件 

设 相应 于 k=3 种 类 型 的 三 种 结果 用 A, B. CRR, 出现 三 种 
类 型 的 概率 分 别 是 pi, ps, ps. n 次 试验 结果 的 任何 一 个 观测 都 构 
成 一 个 如 表 4.7 所 示 的 简单 事件 , 每 次 试验 结果 用 观测 到 的 字母 表 
不 . 表 4.7 中 的 简单 事件 是 第 一 次 试验 结果 为 C, 第 二 次 试验 结果 -C À À B A C on B 
为 A, 第 三 次 试验 结果 为 A, …, 最 后 一 次 试验 结果 为 B. | U^ 

现在 考虑 得 到 yi 次 A、y, 次 B. ys KC 的 简单 事件 ,其 中 ty + ys =n. 这 些 简单 事件 之 一 显 
RUF: 
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y Ja ys 
AAA--A BBB--B CCC--C 
这 个 有 个 A、y $ B. ys 个 C 的 简单 事件 的 概率 是 : 
(m1)? (p)? (p3)” 

在 样本 空间 S 中 有 多 少 个 简单 事件 含有 yi MA y NB, y 个 C? 这 个 数 等 于 在 个 不 同 的 位 
置 上 安排 yj TA. y + B. y, 个 C 时 不 同方 法 的 个 数 . 由 定理 3.3 可 知 ， TRUE y; A A, yo 4 B. y, 个 
C 的 方法 个 数 是 : 

n! 
yi! y>! ys! 

因此 , Anal yz! y31) 个 简单 事件 得 到 yi 个 A、y, 4 B. y, + C, 每 个 简单 事件 的 概率 均 
A (pi)”' (p)? (ps). 所 以 在 n 次 试验 中 观测 到 yi 次 A、y IK B. ys 次 C 的 概率 等 于 这 些 简单 事件 
的 概率 之 和 : 


n 


! 
POY Ya ya) =—— —— pi)? (p3)2 (p) 
! 2:43 yil! yo! ys! ! ? 3 


可 以 验证 这 是 用 k=3 时 代入 框 格 中 多 项 概率 分 布 公式 所 得 到 的 表达 式 . 
对 某 种 类 型 ,例如 类 型 i 的 个 数 的 期 望 值 或 均值 由 二 项 随机 变量 的 性 质 直 接 可 得 . 如 果 我 们 将 不 
同 于 类 型 ;的 所 有 类 型 合成 一 类 , 那么 多 种 分 类 就 变 成 了 两 种 分 类 : 有 Y, 个 观测 在 类 型 ?中 ，(m — 
8;) 个 观测 在 合并 的 类 型 中 . 由 二 项 随机 变量 期 望 值 和 方差 的 知识 有 : 
E(Y;) = np; 
V(Y;) =np,(1 —p;) 
CHA 参考 例 4.9, 在 计算 机 电力 系统 中 的 中 性 对 满载 电流 比 的 研究 , 假设 电气 工程 师 发 现 
10% 的 系统 有 高 比例 ,30% 的 中 等 比例 , 60% 的 低 比例 , 考虑 n=40 个 站 点 的 计算 机 系统 的 随机 
样本 . 
a 求 有 10 个 站 点 有 高 比例 的 中 性 对 满载 电流 比 , 10 个 站 点 比例 适中 , 20 个 站 点 比例 低 的 概率 ， 
b. 求 有 高 比例 的 中 性 对 满载 电流 比 站 点 数量 的 均值 和 方差 , 并 用 此 信息 估计 在 大 小 为 40 样本 
中 有 高 比例 的 中 性 对 满载 电流 比 站 点 的 数量 . 
解 在 解 例 4.9 时 , 我 们 证 明了 二 项 试验 的 性 质 是 满足 的 , 这 个 例子 将 二 项 试验 简单 地 推广 到 
对 每 个 站 点 有 k=3 个 可 能 结果 (高 、 中 、 低 比例 ). 因此 多 项 试验 的 性 质 是 满足 的 , 这 样 , 我们 可 以 
应 用 框 格 中 给 出 的 公式 . 
a. 定义 : 
Y, = 有 较 高 比例 的 站 点 个 数 
Y, = 有 中 等 比例 的 站 点 个 数 
Y; = 有 较 低 比例 的 站 点 个 数 
Pi = 一 个 站 点 有 高 比例 的 概率 
px = 一 个 站 点 有 中 等 比例 的 概率 
ps = 一 个 站 点 有 低 比 例 的 概率 
下 面 我 们 求 概率 PY, =10, Y, =10, Y, 220) =p(10, 10, 20) , 利用 公式 


plY1, Y2, Y3) = (pi ) (p;)? (p) 


n! 
yi! ya! ys! 
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rh n 240, pi, pa, ps 估计 值 分 别 为 0.1, 0.3, 0.6, 代 人 这 些 值 , 我 们 得 到 


107 101 207(0 1)10(0.3)10(0.6)20 =0. 000 549 8 


b. 我 们 希望 求 出 有 高 的 中 性 对 满载 电流 比 的 站 点 个 数 了 | 的 均值 和 方差 , 由 多 项 概率 分 布 公 
式 得 ， 


p(10, 10, 20) = 


pa =np! :40(0.1) =4 
和 
o? =npi(1 -pi) =40(0.1)(0.9) =3.6 
由 经 验 法 则 , 我 们 期 望 样本 中 高 的 中 性 对 满载 电流 比 站 点 的 个 数 Y, 落 人 它 的 均值 的 2 个 标准 差 范 
围 内 , 即 在 
A 720, =4 -2./3.6 20.21 

















和 
Dd 24 +2,/3. 6 27.80 
之 间 . 由 于 Y, 只 能 取 整 数值 0， `, 所 以 我 们 期 望 有 较 高 比例 的 站 点 个 数 应 落 在 1 与 7 
之 间 . 
应 用 练习 I N Eo g 
4.40 dE) E. 参考 练习 4. 1, Annals of the Ento- 木材 /纸浆 0. 30 
mological society of America(2005 年 1 月 ) 对 南美 飞 谷物 /食品 0. 10 
剧 科 物种 生命 周期 的 研究 . 回想 昆虫 学 家 发 现 飞 剧 金属 0.07 
是 水 葫芦 的 天 敌 , 下 表 重 新 给 出 水 昔 芦 的 叶片 上 电力 0.07 
#14.24.34.4485BB E ZH 考虑 从 塑料 /矿石 /纺织 0. 08 
飞 融 栖 居 的 环境 中 挑 出 100 个 水 葫芦 叶片 的 样本 . —M oo%  _ 
a XAR ME T ama TRADE Fak pontion adde 
+, MAU 求 一 Uem A BR, Vol. 23, Ne 3, Spet. 2004 Re 23. x e 
mx 7 o TERRAS RAM 。 未 木材 /纸浆 工业 发 生 7 次 爆炸 ,谷物 /食品 二 
业 发 生 5 次 爆炸 , 金属 工业 发 生 2 次 爆炸 , 电力 
工业 不 发 生 爆 炸 , 塑料 /矿石 /纺织 工业 发 生 1 
DS 2PM 348 605 次 爆炸 ,其 他 工业 发 生 5 次 爆炸 的 概率 . 
叶片 百分数 40 54 2 4 b. 求 木 材 /纸浆 工业 发 生 爆 炸 少 于 3 次 的 概率 . 
资料 来 源 ; Sosa, A. J. , et al. “Life history of Megamelus 442 与 学 习 有 关 的 工程 工作 . 参考 练 2] 2.2, 
scutellaris with description of immature atages" , Annals of the Mechanical Engineering (2004 年 11 H ) 对 它 的 读者 
Entomological Society of America, Vol. 98, No. 1, Jan. 2005 的 调查 . 对 问题 “你 的 工作 与 你 在 学 校 所 学 的 工程 
( 搞 自 于 表 1). 学 课程 有 关 吗 ?” 的 回答 重新 汇总 在 下 表 . 考虑 100 
个 问 到 同样 问题 的 读者 的 样本 . 
441 管道 爆炸 . 在 化 工 工业 中 管道 爆炸 虽然 军 a. 求 样本 中 4 种 回答 ( 依 表 中 次 序 ) 的 人 数 分 别 为 
见 , 但 却 有 伤害 和 设备 损坏 的 极 大 隐患 . Process 40,30,10 和 20 的 概率 . 
Safety Progress( 2004 年 9 月) 报告 了 管道 爆炸 事 b， 你 期 望 样 本 中 有 多 少 读者 是 回答 “是 的 ,我 的 工 
故 的 可 能 性 , 下 表 给 出 几 个 发 生 过 管道 爆炸 的 作 与 所 学 的 紧密 相关 ”? 


全 球 化 产业 的 事故 率 , 假定 明年 全 球 发 生 20 次 c. 你 期 望 样本 中 有 多 少 读者 是 回答 “不 ， 这 是 工程 
管道 爆炸 . 学 , 但 不 是 我 学 的 ”? 
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你 的 工作 与 你 在 学 校 所 学 的 
工程 学 课程 有 关 吗 回答 的 百分数 
是 的 ,我 的 工作 与 所 学 的 紧密 相关 29 
F, 这 是 工程 学 , 但 不 是 我 学 的 32 
工作 与 工程 学 无 关 ° 
近期 失业 30 





资料 来 源 : Mechanical Engineering, Vol. 126, No. 11, No- 
vember 2004. 

43 计算 机 越权 使 用 . 参考 练习 2.5, Computer Se- 
curity Issues & Trends (2001 年 春 ) 对 计算 机 安全 员 
的 调查 . 对 问题 “你 公司 的 网 址 是 否 被 越权 使 用 ? 
这 种 侵犯 来 自 哪里 ? 是 公司 内 部 还 是 公司 外 部 ?” 
回答 见 下 表 . 考虑 50 个 被 越权 使 用 网 址 的 公司 
样本 . 





WWW 网 址 侵犯 百 分 数 
内 部 4 
外 部 47 
内 外 结合 23 
未 知 26 
总 计 100 


资料 来 源 :“2001 CSI/FBI Computer Crime and Security Sur- 

vey. " Computer Security Issues & Trends, Vol. 7, No. l, 

Spring 2001. : 

a. 求 有 5 家 公司 受到 内 部 侵犯 、10 家 公司 受到 外 
部 侵犯 、15 家 公司 受到 内 外 结合 侵犯 、20 家 公 
司 受到 未 知 侵犯 的 概率 . 

b. 你 期 望 样本 中 有 多 少 家 公司 受到 外 部 侵犯 ? 

c. 求 受 外 部 侵犯 的 公司 个 数 的 方差 . 

d. 利用 你 在 b、e 中 的 答案 , 给 出 可 能 包含 受 外 部 
侵犯 公司 的 个 数 的 区 间 . 


.44 检测 超载 货车 , 超载 虽然 非法 , 但 在 货运 行业 


却 是 常见 的 . 明尼苏达 州 交通 部 (MDOT) 工程 师 用 

安装 在 高 速 公 路 上 的 无 人 操纵 计算 机 秤 监视 行驶 

在 州 际 高 速 公路 上 的 超载 货车 . 当 货 车 通过 秤 时 ， 

秤 可 以 称 出 货车 的 重量 , 而 司机 却 不 知道 . 一 周 之 

A, 有 400 多 辆 五 轴 卡 车 认为 超载 . 下 表 给 出 了 这 

周 内 每 天 发 现 超载 货车 的 比例 , 假定 每 周 超载 货 

车 的 日 分 布 都 保持 不 变 . 

a 如果 一 周 之 内 发 现 有 200 辆 货车 超载 , 那么 从 
星期 一 到 星期 日 分 别 发 现 了 50,50,30,30,20,10 
和 10 辆 超载 货车 的 概率 是 多 少 ? 

b. 如果 一 周 之 内 发 现 有 200 辆 货车 超载 , 那么 星 
期 一 至 少 发 现 50 辆 的 概率 是 多 少 ? 


周一 二 三 四 五 六 H 
百分数 0.22 0.20 0.17 0.17 0.12 0.05 0.07 
资料 来 源 : 明尼苏达 州 交通 部 . 

4.45 颜色 作为 身体 定位 线索 . 为 了 弥补 由 于 失重 造 
成 迷失 方向 , 宇航 员 只 能 依靠 视觉 信息 建立 上 下 
定位 . 用 色彩 作为 身体 定位 线索 的 可 能 性 在 Human 
Factors( 1988 年 12 月 ) 中 进行 了 研究 . 90 名 大 学 生 
在 暴 暗 中 斜 靠 着 后 背 ， 缓 慢 旋转 挡住 他 们 视线 的 
圆 盘 , 在 旋转 的 平台 上 迷失 了 方向 . 要 求 接受 试验 
者 觉得 左 侧 向 上 时 就 说 “ 停 ”， 记 录 每 个 学 生 身 体 
的 定位 与 圆 盘 上 亮度 模式 位 置 的 关系 . 受 试 者 只 能 
选择 三 种 圆 盘 亮度 模式 作为 主观 的 垂直 线索 : (1) 
亮 侧 朝 上 ; (2) 暗 侧 朝 上 ; (3) 亮 侧 和 暗 侧 对 准 受 
试 者 头 部 的 任 一 侧 . 根据 研究 结果 , 受 试 者 选择 三 
种 圆 盘 定 位 的 概率 分 别 为 0. 65 ,0. 15 和 0.20. 假设 
n =8 个 受 试 者 做 相同 的 试验 . 

a 所 有 8 个 受 试 者 选择 亮 侧 朝 上 圆 盘 定 位 的 概率 
是 多 少 ? 

b. 4 个 受 试 者 选择 亮 侧 朝 上 圆 盘 定位 , 3 个 受 试 者 
选择 暗 侧 朝 上 圆 盘 定位 ,1 个 受 试 者 选择 对 准 
定位 的 概率 是 多 少 ? 

c. 8 个 爱 试 者 中 平均 有 多 少 个 选择 亮 侧 朝 上 圆 盘 
定位 ? 

4.46 通过 电阻 的 电流 . 电流 可 以 从 三 条 不 同 的 电路 
通过 电阻 , 概率 分 别 为 p, 20.25, p, =0.30, p, = 
0. 45. 假设 连续 做 n=10 次 试验 , 监测 所 走 的 路 线 . 
a 求 电流 通过 第 一 条 电路 Y, =2 次 、 第 二 条 电路 

Y, =4 次 、 第 三 条 电路 Y, =4 次 的 概率 . 

b. 3K E(Y,) RH V(Y,) , 解释 结果 . 

4.47 修理 钻头 . 从 一 大 批 剪 切 钻头 中 抽出 容量 为 
的 样本 . 假设 恰 有 一 个 缺陷 的 钴 头 比例 为 p, EF 
1 个 缺陷 的 钴 头 比例 为 po (p, +p «1), 替换 或 修 
理 有 缺陷 钻头 的 费用 是 C =4Y, + Y,, 其 中 Y, 表示 
有 一 个 缺陷 的 钻头 个 数 ，Y, 表示 有 两 个 或 更 多 缺 
陷 的 钻头 个 数 , 求 C 的 期 望 值 . 


(8) 理论 练习 
4.48 有 一 个 上 =3, n=2 的 多 项 分 布 , 证 明 : 
> P(Y, y» ys) = 1 


(提示 : 应 用 二 项 定理 ( 见 理论 练习 4. 36) 展开 和 式 
[a+ (8+e)]?， 再 把 二 项 展开 (5 +e)? 代入 所 得 的 
表达 式 中 , 最 后 将 a =p. bop, cop 代入 ) 
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4.8 负 二 项 概率 分 布 和 几何 概率 分 布 


我 们 常常 喜欢 度量 某 个 事件 发 生前 所 需 时 间 的 长 度 . 例如 , 一 位 顾客 排队 等 候 直 到 得 到 服务 的 
时 间 长 度 , 或 直到 一 个 设备 失效 的 时 间 长 度 . 

对 这 种 应 用 我 们 可 以 将 每 个 时 间 单 位 视 为 有 成 功 ( S) TUK Mk (F) 两 种 结果 的 伯 努 利 试验 , 并 考 
虑 一 系列 与 二 项 试验 (4. 6 节 ) 描述 的 相同 试验 . 与 二 项 试验 不 一 样 的 是 了 不 是 总 的 成 功 次 数 ,在 这 
里 感 兴趣 的 随机 变量 了 表示 直至 观测 到 第 + 次 成 功 时 试验 (时 间 单位 ) 8 

随机 变量 的 概率 分 布 称 为 负 二 项 分 布 . 下 面 的 框 格 中 给 出 了 负 二 项 随机 变量 的 概率 分 布 、 均 
值 和 方差 的 公式 . 





负 二 项 概率 分 布 
负 二 项 随机 变量 了 的 概率 分 布 为 : 1 


-1 
p(y) (up? (y=r,r+l,r+2, =) 


其 中 , P= 一 次 伯 努 利 试验 成 功 的 概率 ; g=1 -p; y= 直至 观测 到 第 r 次 成 功 的 试验 次 数 . 
负 二 项 随机 变量 的 均值 和 方差 分 别 是 











可 以 看 出 负 二 项 概率 分 布 是 两 个 参数 P M r 的 函数 . 对 于 = 1 的 特殊 情况 ， Y 的 概率 分 布 称 为 几 
何 概率 分 布 . 


1 





几何 概率 分 布 
p(y) WU (y21,2, =) 
其 中 , Y= 第 一 次 成 功 时 试验 的 次 数 ; Dn ? 2.9. 


本 
p 











为 了 导出 负 二 项 概率 分 布 , 注意 , 直至 第 次 成 功 的 y 次 试验 中 得 到 的 每 个 简单 事件 包含 
(y -7) 次 失败 和 7 次 成 功 , 描述 如 下 : 
人 站 次 失败 和 {7 Dus 第 7 次 成 功 
j FFSFF.-SF o 5 ` 
在 第 > 次 成 功 前 有 (7y -7) 次 失败 的 所 有 简单 事件 的 个 数 等 于 (r 1) 次 成 功 和 (yr) 次 失败 排列 方法 
BJ, HJ 





(nun megu) 


所 以 , 由 于 每 个 这 样 的 简单 事件 的 概率 都 是 p'gr-", 我 们 有 : 
p(y) (Lee 
1j] 4. 13 和 例 4. 14 分 别 是 负 二 项 概率 分 布 和 几何 概率 分 布 的 应 用 
| 例 4. 13 | 为 了 安装 发 动机 的 外 壳 , 生产线 上 的 装配 工 必须 用 一 个 电动 工具 安装 并 拧紧 4 个 螺栓 ， 
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TE 1s 之 内 完成 装配 并 拧紧 螺栓 的 概率 P = 0. 8. 如 果 装 配 工 在 第 1s 之 内 没完 成 , 在 第 2 s 之 内 完成 的 
概率 也 是 0.8, 等 等 . 

a. 求 直到 安装 完 外 壳 所 用 的 时 间 长 度 了 的 概率 分 布 . 

b. 3K p(6). 

c. 求 了 的 均值 和 方差 . 

解 . 

a 由 于 外 沉 有 r=4 个 螺栓 , 我 们 用 负 二 项 概率 分 布 公式 , 将 p =0.8 和 r=4 代入 p(y) 的 公式 
中 , 我 们 得 到 : 


py) (Layee7 (5) 27 
b. 为 了 求 了 =6 s 完成 装配 操作 的 概率 ， 我 们 将 y=6 代入 a 中 得 到 的 公式 , 得 
p(y) = (5) *0.2? = (10) (0. 4096) (0. 04) =0. 163 84 
c， 对 于 这 个 负 二 项 概率 分 布 ， 


和 
2_ rq 4(0.2) _ 
p^ (0.8)? =1.25 
CESE 生产 商 在 电子 系统 中 需要 电 熔 丝 , 电 熔 丝 是 成 批 购 入 的 ,然后 逐个 测试 ,直到 发 现 第 
个 不 合格 电 熔 丝 , 假设 这 批 电 熔 丝 中 有 10% 的 不 合格 品 . 
a 第 一 个 不 合格 品 是 前 5 个 测试 的 电 熔 丝 之 一 的 概率 是 多 少 . 
b. 求 直 至 观测 到 第 一 个 不 合格 电 熔 丝 时 ,测试 的 电 熔 丝 个 数 了 的 均值 、 方 差 和 标准 差 
f 
a 直到 第 一 个 不 合格 的 电 熔 丝 出 现时 ,已 检验 过 的 电 熔 丝 数量 了 是 -个 几何 随机 变量 . 
P=0.1 (一 个 电 熔 丝 是 不 合格 的 概率 ) 
q-1-pz0.9 





"m 
p(y) =p! (yz1,2, =) 2 (0.1) (0.9)»-! 
SE — T ATEUBURZL TERIS 个 检测 过 的 电 熔 丝 之 的 概率 是 ， 
P(Y=5) -p(1) +p(2) + +p(5) 
- (0.1) (0.9)? +(0.1)(0.9)! * (0.1) (0.9)^4 =0. 41 
b. 这 个 几何 随机 变量 的 均值 ,方差 和 标准 差 是 . 





"p 961-09 
2.4 . 0.9 -90 
7 p (019 
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(8) 应 用 练习 


4. 


= 


4 鼻涕 忠 的 分 布 . AIUB Journal of Science and En- 
gineering(2003 4E 8 月 ) 发 表 了 研究 栖 居 在 利比亚 
的 有 肺 鼻涕 虫 的 分 布 形式 , 在 调查 地 区 发 现 某 一 
物种 的 鼻涕 虫 个 数 可 以 用 负 二 项 分 布 建 模 ， 假定 
在 调查 地 区 观测 到 某 一 物种 (如 米 拉克 斯 天 牛 ) 的 
鼻涕 虫 概 率 为 0.2,， 令 了 表示 为 获得 10 个 米 拉克 
斯 天 牛 的 样本 所 必须 挑选 的 鼻涕 虫 个 数 . 

a. 给 出 了 的 概率 分 布 公式 . 

b. 了 的 期 望 值 是 什么 ? 解释 此 值 . 

c. 求 P(Y=25). 


.50 聚变 反应 放射 的 微粒 . 碳 氮 氧 (CNO ) 循环 是 


一 种 聚变 反应 , 通过 反应 使 氢 变 换 为 氨 ,， 关于 空间 
CNO 质子 反应 产生 的 高 能 电荷 分 布 的 研究 发 表 在 
Journal of Physics G; Nuclear and Particle Physics 
(1996 年 11 H). 当 高 能 反应 发 生 时 , 释放 带电 粒 
F, 这 些 粒 子 分 为 两 类 : 流 粒子 和 重 粒 子 . 为 了 发 
现 r 个 带电 流 粒子 必须 观测 的 带电 粒子 个 数 为 p = 
0.75 的 负 二 项 分 布 , 利用 这 个 信息 求 为 发 现 3 个 
带电 流 粒 子 需要 观测 5 个 带电 粒子 的 概率 . 

51 得 克 萨 斯 旱灾 重 现 . 干旱 季节 是 天 气 特 别 干旱 
导致 一 个 地 区 水 分 严重 失衡 的 一 段 时 期 ， 帕 耳 旱 
灾 指 数 (PDI) 用 来 定量 地 测量 干旱 的 严重 性 . -1 
或 更 小 的 PDI 和 值 表示 一 个 干燥 (干旱 ) 期 , PDI 值 大 
于 -1 表示 潮湿 ( 非 干旱 ) 期 , 亚利桑那 大 学 的 工程 


um 


师 利用 古生物 学 数据 和 历史 记载 确定 了 得 克 萨 斯 

过 去 400 年 里 每 年 的 PDI 值 ，(Journal of Hydrologic 

Engineering , 2003 年 9/10 月 ). 研究 者 发 现 , 直到 

出 现 干 旱 年 需要 抽样 的 年 份 数 Y 了 近似 服从 几何 分 

布 , 分 布 图 如 下 . 

a. 通过 图 形 估 计 E(7) (提示: 利用 4.3 节 的 公式 . ) 

b. 利用 a 的 结果 估计 刀 何 分 布 的 p 值 . 

c. 估计 为 了 观测 到 一 个 干旱 年 必须 抽样 7 年 的 
概率 . 

S2 航天 飞机 故障 . 美国 国家 宇航 局 (NASA ) f 

计 一 架 航 天 飞机 主 发 动机 的 关键 部 件 故障 可 能 

性 大 约 是 1⁄63 ( Tampa Tribune, 1993 4E 12 月 3 

H). 飞行 期 间 关 键 部 件 的 故障 将 直接 导致 飞机 

事故 . 

a. 关键 部 件 故障 前 飞机 平均 完成 多 少 次 飞行 任务 ? 

b. 关键 部 件 故 障 前 飞行 次 数 的 标准 差 是 多 少 ? 

e. 给 出 一 个 以 大 约 0. 95 概率 包含 关键 部 件 故障 前 
的 飞行 次 数 的 区 间 . 


.53 鱼 内 的 条 贝 , 地 中 海鱼 类 体内 寄生 虫 (条 虫 ) 


的 分 布 可 以 用 负 二 项 分 布 建 模 ，( Journal. of Fish 
Biology, 1990 年 8 月 ) 假 定 关 心 的 事件 是 比目鱼 消 
化 道内 是 否 发 现 寄 生 虫 , 令 了 表示 直到 发 现 一 条 
有 寄生 虫 的 比目鱼 时 必须 抽样 的 比目鱼 数量 , 研 
究 人 员 估 计 一 条 鱼 被 感染 的 概率 是 0.544, 利用 这 
个 信息 估计 下 面 的 概率 : 





25 
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10 
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13 14 15 


NUMBER OF YEARS TILL DROUGHT 


2&2] 4.51 的 MINITAB 输出 
资料 来 源 : Gonzalez, J. , and Valdes, J. B. “Bivariate drought recurrence analysis using tree ring 
reconstructions. ” Journal of Hydrologic Engineering, Vol. 8, No. 5, Sept. /Oct. 2003 (图 5). 
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a P(Y=3). 
b. P(Yx2). 

c. P(Y»2). 

4.54 环境 保护 论 者 的 分 类 . 环保 工程 师 将 消费 者 分 
为 5 类. (对 每 组 的 描述 见 练习 3. 3 ) 每 组 的 概率 
ADF: 


非 绿色 消费 者 0. 28 
真诚 的 绿色 消费 者 0.11 
钞票 绿色 者 0.11 
新 绿色 者 0. 26 
抱怨 者 0.24 


资料 来 源 : The Orange Country Register, Aug. 7, 1990. 

令 了 等 于 直到 第 一 个 环境 保护 论 者 出 现时 必须 抽 

取 的 消费 者 的 个 数 ( 由 练习 3.3, 一 个 环境 保护 者 

是 真诚 的 绿色 者 、 钞 票 绿色 者 或 新 绿色 者 ) 

a. 把 了 的 概率 分 布 列 成 表 . 

b. 给 出 p(y) 的 公式 . 

c. 求 了 的 均值 上 4 和 标准 差 c. 

d. 利用 a 的 信息 , 形成 一 个 以 较 高 概率 包含 了 的 
区 间 . 


4.55 找到 石油 的 概率 . 假设 在 一 个 销 井 位 置 找到 石 


油 与 另 一 个 位 置 相互 独立 , 在 某 个 地 区 , 在 一 个 位 


a. 钻井 工 在 第 三 次 或 在 第 三 次 钻井 之 前 找到 石油 
的 概率 是 多 少 ? 

b. 如 果 了 是 直到 第 一 次 成 功 开采 时 的 钻井 次 数 ， 
求 了 的 均值 和 标准 差 . 

c. 工 有 可 能 超过 10 吗 ? 解释 原因 . 

d. 假设 销 井 公司 认为 如 果 直 到 第 二 次 成 功 时 ， 钻 
井 次 数 等 于 7 次 或 不 到 7 次 ,这 种 冒险 是 有 利 
可 图 的 , 求 冒险 成 功 的 概率 . 


4.56 中 性 粒子 反射 . 参考 练习 4. 34, Nuclear Science 


and Engineering 的 研究 , 如果 每 次 释放 一 个 中 性 粒 
子 进入 真空 管道 , 求 直 到 发 现 有 两 个 粒子 被 管道 内 
壁 反射 时 需要 释放 的 粒子 超过 5 个 的 概率 . 


理论 练习 
4.57 设 了 是 一 个 参数 为 p 和 7 的 负 二 项 随机 变 


E, AER W = Y - r 也 是 一 个 负 二 项 随机 变 
E. 其 中 外表 示 第 7 次 成 功 之 前 失败 的 次 数 . K 
用 事实 
E(Y)=— 和 o4 
p 
证 明 : 


2 
P 


(提示 : 利用 定理 4.1、4.2 304.3. ) 


E(W) = 和 o= 


置 成 功 找到 石油 的 概率 是 0. 3. 


4.9 超 几何 概率 分 布 


当 我 们 从 一 个 成 功 和 失败 的 有 限 总 体 ( 例如 ， 顾客 的 偏好 响应 有 限 总 体 或 对 包含 合格 和 不 合格 
制造 品 的 货物 的 有 限 次 观测 集合 ) 中 抽取 样本 时 ， 如 果 观 测 每 次 试验 结果 , 然后 在 下 一 次 观测 之 前 
放 回 总 体 , 严格 地 满足 二 项 试验 , 这 种 抽样 的 方法 称 为 有 放 回 抽样 ， 而 在 实际 当中 , 我 们 通常 是 无 放 
回 抽样 ， 即 总 体 中 有 N 个 元 素 , 我 们 从 中 随机 抽取 ”个 不 同 的 元 素 , 正如 4 6 节 所 说 的 , 当 六 很 大 ， 
E n/N 很 小 (如 小 于 0.05) 时 , 得 到 一 个 成 功 的 概率 大 致 与 其 他 次 试验 相同 ， 试验 是 (基本 上 ) 独 立 
的 , 成 功 次 数 Y 的 概率 分 布 近似 为 一 个 二 项 概率 分 布 . 然而 当 NN 小 , 或 n/N 大 (如 大 于 0.05) 时 , 我 
们 希望 利用 了 的 精确 概率 分 布 , 这 个 分 布 称 为 超 几 何 概率 分 布 ， 是 本 节 主 要 讨论 的 内 容 . 下 面 的 方 
框 定义 了 超 几 何 随 机 变量 的 特征 及 其 概率 分 布 . 





确定 超 几 何 随 机 变量 的 特征 
1. 试验 是 从 六 个 元 素 ， 其 中 有 r 个 5S( 成 功 ) 和 NN-r 个 FF( 失 败 ) 集 合 中 无 放 回 地 随机 抽取 个 元 素 . 
2. 样本 容量 相对 于 总 体 元 素 的 个 数 入 是 大 的 ， 即 n/N >0.05. 
3, 超 几何 随机 变量 了 是 抽出 的 nn 个 元 素 中 5 的 个 数 . 
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超 几何 概率 分 布 
超 几 何 概率 分 布 由 下 式 给 出 : 


ry/N-r 
p(y) UG y= Maximum[0, n - (N -r)], =+, Minimum(r, n) 


RF, N= 元 素 的 总 个 数 ; r=N 个 元素 中 成 功 的 个 数 ; n= 抽出 的 元 素 个 数 ;y SEE n ACRI 
的 个 数 . 
超 儿 何 随机 变量 的 均值 和 方差 分 别 是 : f 
_- 32 r(N-r)n(N-n) 
ESNI 7 C N(N-D 














为 了 导出 超 几何 概率 分 布 , 我 们 首先 注意 样本 空间 S 中 简单 事件 的 总 数 等 于 从 N 个 元 素 中 任 
取 n 个 元 素 的 方法 数 , M(N). 一 个 包含 y 次 成 功 的 简单 事件 就 是 上 个 元 素 的 选取 , 其 中 有 ?个 成 
功 和 (n -7) 个 失败 . 由 于 共有 7 个 成 功 元 素 可 以 被 选择 , 所 以 从 中 选 出 y 个 的 不 同方 法 数 有 & = 
( JF NOt, M N- r PAMER a- PER, BIA b= (P oma seen 
应 用 定理 3. 1, 确定 取出 y 个 成 功 和 (nm -y) 个 失败 的 方法 个 数 , 也 就 是 含有 y 个 成 功 的 简单 事件 
个 数 : 
ri N-r 
«S2 (D, 7) 
最 后 , 由 于 任何 个 元 素 的 选取 都 是 等 可 能 的 , 所 有 这 些 简单 事件 都 是 等 概率 的 ,从 而 
r\/N-r 
(y doin enn lyla) 
PN 简单 事件 的 个 数 (~ 


n 





OH 试验 是 挑选 对 用 于 生产 肥皂 的 商品 乙 二 胺 (EDA) 合 适 的 催化 剂 . 假设 药剂 师 从 10 
种 催化 剂 中 随机 地 挑选 三 种 进行 测试 , 这 10 种 催化 剂 中 有 6 种 酸性 较 低 , 4 种 酸性 较 高 . 

a. 求 没有 高 酸性 催化 剂 被 选中 的 概率 . 

b. 恰 有 一 种 高 酸性 催化 剂 被 选中 的 概率 . 

解 令 了 表示 选中 高 酸性 催化 剂 数量 , 则 了 是 一 个 超 几何 随机 变量 , N=10, n=3, r=4, H 





4i 6 
P(Y=y) =p(y) (7) 


10V 
3 
a. p(0) - (JS) .(0)0Q0) 1 


(3) 120 6` 
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(5 + 
b. p(1) = N O). 1. -1 
(3) 
DEM 参考 例 4.15 中 的 EDA 试验 . 840r 
a. RENEE Y BJ u, o? Mo. 2i 
b. R P(u. -2e «Y «p +20), 这 个 结果 如 何 
与 经 验 法 则 比较 . e 


解 
a. 由 于 了 是 一 个 超 几 何 随 机 变量 ， N = 10， 0.10 
n=3,r=4, 均值 和 方差 是 ， 














d L 
=w D -1.2 0 1 | 2 | 3 
2 r(N-r)n(N-n) 4(10-4)3(10 -3) — à AM dee | 
— N(N-1)  (10)(10-1) 
2 (0(8) 3) C). se 图 4.6 4.16 rP Y RERA 
~ (100) (9) i 
标准 差 是 : 
= ,/0. 56 =0. 75 
b. 图 4. 6 Ab TEMERE u +20. 即 ( -0.3, 2.7). 落 在 区 间 之 外 的 可 能 值 只 有 Y=3, 所 以 
Go) a 
P(u -20 «y«u*20) =1-p(3)=1 (*) =1- po 79.967 
3 


根据 经 验 法 则 , 我 们 期 望 大 约 有 95% 的 了 观测 值 落 人 此 区 间 , 因此 经 验 法 则 为 这 个 概率 提供 了 
en 


参考 例 4. 15, 求 随机 变量 了 的 均值 人 
SR 由 定义 4.4， 
4 6 
-ap = Z = Š 网 
H= = Na Y Y" C OY ` 120 
利用 例 4 15 和 4. 16 计算 出 来 的 p(y) 的 值 以 及 





41/6 
pep Bin 3 T =l 


将 它们 代入 得 


J=0p(0) +1p(1) +2p(2) +3p(3) =0+1( : ) (15) *3(s) -12 





2 
注意 , 这 是 例 4. 16 中 应 用 前 面 给 出 的 超 几 何 概率 分 布 公式 得 到 的 值 . 
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应 用 练习 

4.58 有 害 废 物 定点 处 理 . 资源 保护 和 回收 法 规定 了 

美国 工厂 生产 的 有 害 废 物 的 追踪 与 处 理 . Profes- 

sional Geographer(2000 年 2 月 ) 报 道 了 209 个 工厂 

有 害 废物 的 形成 和 处 理 的 特点 , 在 这 些 工厂 中 仅 

有 8 个 工厂 到 指定 地 点 处 理 有 害 废物 . 

a. 209 个 工厂 中 随机 抽样 10 个 , 在 10 个 工厂 中 到 
指定 地 点 处 理 有 害 废物 的 工厂 期 望 是 多 少 ? 解 
释 此 结果 . 

b， 选 出 的 8 个 工厂 中 有 4 个 工厂 是 到 指定 地 点 处 
理 有 害 废物 的 概率 . 

. 59 污染 的 枪弹 . 参考 练习 4.3, 武器 制造 商 调查 

污染 的 枪弹 ， 从 一 批 产品 中 挑 出 158 个 枪弹 的 样本 

中 , 发 现 36 个 是 污染 的 , 122 个 是 “干净 "的 , 如 果 

你 从 这 158 个 枪弹 中 随机 地 选 出 5 个 ,5 个 全 部 是 

“TE 的 概率 是 多 少 ? 

4.60 ”批量 检测 抽样 . 设想 你 买 一 小 批 产品 , 如 果 检 
测 一 件 产品 很 贵 ,可 以 设计 从 一 批 中 抽取 几 件 作为 
样本 进行 检测 ,而 不 用 对 每 一 件 都 进行 检测 . 假设 
每 批 合 10 件 产品 , 你 决定 每 批 中 抽取 4 件 ， 如 果 发 
RA ! 件 或 更 多 产品 不 合格 , 你 将 拒绝 这 批 产 品 . 
a， 如 果 这 批 产 品 有 1 件 不 合格 产品 ,你 接收 这 批 

产品 的 概率 是 多 少 ? 
b， 如 果 这 批 产品 有 2 件 不 合格 产品 ,你 接收 这 批 
产品 的 概率 是 多 少 ? 

4.61 新 西 兰 灭 绝 的 鸟 类 , BHAY 3.24, Evolution- 

ary Ecology Research ( 2003 年 7 月 ) 研究 了 新 西 兰 鸟 

群 灭绝 的 方式 , 在 NZBIRDS 文件 保存 的 132 种 鸟 

类 中 , 38 种 灭绝 了 , 假设 你 从 132 种 鸟 类 中 随机 选 

FE 10 种 (无 放 回 ), 并 记录 下 每 种 的 灭绝 状态 . 

a. 选择 的 10 种 鸟 类 中 恰 有 5 种 是 灭绝 的 概率 是 
多 少 ? 

b. 最 多 有 1 种 是 灭绝 的 概率 是 多 少 ? 

62 物种 热 区 , 物种 热 区 是 有 大 量 物种 的 地 理 区 域 

( 见 练习 3.75). Nature ( 1993 4E 9 月 ) 研究 估计 一 

种 英国 鸟 类 栖 居 在 蝴蝶 热 区 的 概率 是 0.7， 考 虑 从 

10 种 捉 到 的 鸟 类 中 随机 挑选 4 种 英国 鸟 类 作为 样 

Ak, 假设 10 种 捉 到 的 鸟 类 里 有 7 种 栖 居 在 蝴蝶 

RE. 

a. A 种 鸟 类 的 样本 中 恰 有 一 半 栖 居 在 蝴蝶 热 区 的 
概率 是 多 少 ? 

b. 4 种 鸟 类 的 样本 中 至 少 有 -- 种 鸟 类 栖 居 在 蝴蝶 
热 区 的 概率 是 多 少 ? 


+ 


= 


463 无 人 监控 系统 . 参考 练习 4. 33 , IEEE Computer 
Applications in Power(1990 年 4 月 ) 报 道 ,户外 无 人 
操纵 计算 机 摄像 系统 在 下 雪 天 发 现 了 10 4-BJ A £ 
中 的 7 个, 假设 其 中 2 个 间 和 信者 有 犯罪 企图 , 这 2 
个 净 人 者 都 被 系统 发 现 的 概率 是 多 少 ? 

. 64 污染 控制 条 例 . 由 环境 保护 机 构建 立 的 工作 队 

安排 去 调查 20 家 工业 公司 是 否 违 反 了 污染 控制 条 

例 . 然而 , 财政 预算 的 减少 使 工作 队 的 规模 大 大 缩 

小 了 , 他 们 仅 能 调查 20 家 公司 中 的 3 家 ,如果 已 

知 20 家 公司 中 有 5 家 公司 实际 操作 违反 条 例 , R 

下 列 事件 的 概率 : 

a. 3 家 被 抽样 的 公司 都 没有 发 现 违反 条 例 . 

b. 被 调查 的 3 家 公司 全 都 发 现 违反 条 例 . 

e. 3 家 公司 中 至 少 有 1 家 操作 违反 污染 控制 条 例 . 

65 KATERA. 在 American Statistician ( 1991 

年 5 月 ) 的 一 篇 论文 中 描述 了 概率 在 撤销 可 卡 因 谴 

责 的 用 处 . 在 一 个 中 等 大 小 的 佛罗里达 城市 , 警察 

在 一 次 可 卡 因 搜捕 中 查获 了 496 包 , 为 了 证 明 药物 

TRAC TE , 警察 必须 证 明 锡 包 里 有 真正 的 可 卡 因 ， 

于 是 警察 随机 抽取 4 包 进 行 化 学 测试 , 被 测 的 4 包 

全 呈 可 卡 央 阳性 , 这 个 结果 证 明 据 客 有 罪 . 

a 在 查获 的 496 包 中 , 假设 有 331 包含 有 真正 的 
可 卡 因 , 165 包含 中 性 粉末 (合法 的 ), 求 随机 抽 
取 的 4 包 全 呈 可 卡 因 阳性 的 概率 . 

b. 在 撤销 恋 责 的 运作 中 警察 从 剩 下 的 492 包 ( 即 没 
被 检测 的 ) 中 随机 抽出 2 包 , 由 侦探 卖 给 买主 . 
然而 , 从 交易 到 逮捕 , 买主 消 毁 了 证 据 . 已 知 原 
来 的 496 包 中 的 4 包 检 验 全 呈 可 卡 因 阳性 , 在 
撤销 谱 责 时 卖 出 的 2 包 不 含 可 卡 因 的 概率 是 多 
D? 假设 a 提供 的 信息 是 正确 的 . 

c， 当 496 包 中 有 331 包含 真正 的 可 卡 因 , 而 165 所 
RPR, American Statistician 的 文章 证 明 
了 在 b 中 条 件 概 率 达 到 极 大 , 假设 496 包 中 有 
400 包含 有 可 卡 因 , 重新 计算 b 中 的 概率 . 


理论 练习 
4.66 证 明 : 超 几 何 随机 变量 了 的 均值 是 jw = nr/N. 
(提示 : 证 明 


(5) SG ze) 


+ 


>= 





G 0) 


然后 利用 对 Z= (Y-1), 
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r-l\/N-1-(r-1) 是 超 玫 何 概率 分 布 , 其 中 在 (N - 1) 个 元 素 中 共有 
e mu (r 一 1) 个 成 功 时 , Z 是 (n -1) 次 试验 中 成 功 的 次 
N-1 数 . ) 
insi] I 


4.10 ” 泊 松 概率 分 布 


泊 松 概率 分 布 是 以 法 国 数学 家 泊 松 (S. D. Poisson, 1781 一 1840) 命 名 的 , 为 发 生 在 时 间 、 面 积 、 
体积 等 单位 内 稀有 事件 个 数 的 相对 频率 提供 了 一 个 模型 . 1 分 钟 内 计算 机 接 到 的 新 任务 个 数 、 生 产 车 
间 每 月 的 事故 数 、 一 颗 钻 石上 看 得 见 的 瑕 羔 数 都 是 随机 变量 , 它们 的 相对 频率 分 布 可 以 用 泊 松 分 布 
很 好 地 近似 , 下 面 的 方 框 列 出 了 泊 松 随机 变量 的 特征 . 





泊 松 随机 变量 的 特征 
L 试验 是 在 给 定 的 时 间 单 位 或 给 定 的 面积 、 体 积 单位 (或 重量 、 距 离 或 其 他 任何 度量 单位 ) 内 发 生 某 个 
FAAA Y. 
2. 事件 发 生 在 给 定时 间 、 面 积 或 体积 单位 内 的 概率 对 所 有 单位 全 都 相同 . 
3. 发 生 在 一 个 时 间 、 面 积 或 体积 单位 内 的 事件 数 与 发 生 在 其 他 单位 内 的 事件 数 是 独立 的 ， 




















下 面 的 方 框 给 出 了 泊 松 随机 变量 的 概率 分 布 均值 和 方差 的 公式 . 注意 , 公式 中 包括 自然 对 数 的 
J& e =2. 718 28…, Æ B. 3 给 出 了 计算 值 p(y) 时 所 需 的 。-? 的 值 . 





泊 松 概率 分 布 
泊 松 随机 变量 了 的 概率 分 布 是 : 
p(y) xa (y=0, 1,2, =) 


RUP, A = 给 定 的 单位 时 间 、 面 积 或 体积 内 事件 的 平均 数 ，e =2. 71828- 
泊 松 随机 变量 的 均值 和 方差 分 别 是 : 




















=à 和 =À 





泊 松 分 布 的 形状 随 均值 的 变化 而 变化 , 如 图 4.7 所 示 . 其 中 给 出 了 j=1, 2,3,4 时 泊 松 分 布 
的 相对 频率 直方 图 . 


p(y) 
0.364- 
0.33 - 
0.30 H} 
0.27 - 
0.24 
0.21 
0.18 
0.15 
0.12 
0.09 H 
0.06 H 
0.03 |- 


相对 频率 
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图 4.7 A=1, 2, 3, 4 时 泊 松 分 布 的 直方 图 


oF 
N 


122 第 4 = 





- RR Lo o 
N +O SO 
we 
S 


ONAC 


LTTTTTTT— 





相对 频率 
ooocooocooo 


i ka pad eh 











相对 频率 














0.18 上 
0.16 上 
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要 0.06 上 
0.04 |= 
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图 4.7 (5) 


LIN 假设 对 某 种 类 型 的 水 泥 混 合 物 ， 每 块 混凝土 样品 上 裂缝 的 数量 了 有 近似 泊 松 概率 分 布 ， 
并 且 设 每 块 样品 裂缝 的 平均 数 是 2. 5. 

a. 求 每 块 混凝土 样品 的 裂缝 数量 了 的 均值 和 标准 差 . 

b. 求 随机 抽取 一 块 混凝土 样品 恰 有 5 AR SUAE BERE. 

e. 求 随机 抽取 一 块 混凝土 样品 有 两 条 或 两 条 以 上 裂缝 的 概率 . 

d. 3X P(u-20<Y<u +20). 此 结果 与 经 验 法 则 一 致 吗 ? 

解 

a， 泊 松 随机 变量 的 均值 和 方差 均 是 A. 因此 ， 
! WL=A=2.5 g?-24A-2.5 
标准 差 是 : 


离散 随机 变量 723 





g = 42.5 21. 58 
b. 我 们 想 求 一 块 混凝土 样品 恰 有 5 条 裂 颖 的 概率 , 了 的 概率 分 布 是 : 





p(y) = 

由 于 入 =2.5, Y=5, e 25 =0.082085( H B.3 8 可 知 ) ， 
p(5) _ 2. De ER - 2.5) (0.082 085) 0.067 
c. d CR CRUCERO sra 我 们 需要 求 
P(Y>2) = p(2) + p(3) +p(4) + = pO) 
为 了 求 这 个 事件 的 概率 ,我 们 必须 考虑 补 事件 , FE 
P(Yz2) -1- P(Yx1) -1-[p(0) +p(1)] =1- 





(2,8) 524-79 (28g 75 
0! 1! 


41,10 mam _2.5(0. Demi. 
根据 泊 松 模型 ， pec RE 713. 
d. Fd 4.8 给 出 了 了 Y 值 在 0 ~9 之 间 的 概 P 
率 分 布 , 也 显示 了 均值 人 =2.5 和 内 +2 区 ou 
间 , 或 -0.7 到 5.7. KE P(u -2e < Y < + 
20) =P(Y<5) , 这 个 概率 在 图 4. 8 中 用 阴影 
表示 . 
仿照 , HER pO), p1), =, pCS) 
计算 出 来 并 求 和 . 然而 , 我 们 利用 累积 泊 松 0207 
概率 表 求 这 个 和 ， 对 不 同 的 泊 松 均值 A, K 





1 -0. 287 =0.713 


0.20 r= 











B.4 给 出 了 部 分 和 p(y). 对 和 = 2.5, | 0 1 E Tuc $046 704 3 I 
， y=0 H | 
> rO) = p(0) +p(1) +… + p(5) X 0. 9581. Ap 9 


因此 , P(Y«5) 20.9581; 由 此 可 见 , 这 个 概 图 4.8 例 4 18 中 Y 的 泊 松 概率 分 布 
率 与 经 验 法 则 的 0. 95 近似 值 一 致 . 
0 Knik, Hs np fR/NCAI np 7) SE, 泊 松 概率 分 布 与 二 项 概率 分 布 有 关 , 可 用 来 近似 二 项 概 
率 分 布 , 这 个 事实 的 证 明 已 超出 了 本 书 的 范围 , 但 可 以 在 Feller( 1968) 中 查 到 . 
设 了 是 一 个 n=25, p=0.1 的 二 项 随机 变量 . 
a. 利用 表 B. 2 确定 P(Y<1) 的 精确 值 . 
b. R P(Y<1) 的 泊 松 近似 值 . (iE 虽然 对 于 比较 大 的 n, 我 们 建议 用 泊 松 近似 值 比较 二 项 概 
率 , 但 在 这 个 例题 中 , 我 们 受 表 B. 2 的 限制 . ) 
解 
a. HÆ B.2, 对 n=25,p=0.1 得 
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P(Y < 1) = Yp(y) = 0.271 
b. 由 于 n=25, p=0.1, 我 们 将 用 均值 为 A =np=(25)(0.1) =2.5 的 泊 松 概率 分 布 近 似 p(y). 
在 表 B. 4 中 找到 和 A 22.5, 我 们 得 到 部 分 和 
P(Y = 1) = X p(y) = 0.2873 


对 PCY<1) 20.271 的 精确 值 来 说 , 考虑 到 这 种 近似 方法 常用 于 远大 于 25 时 的 二 项 概率 分 布 , 这 
个 近似 值 0. 2873 是 合理 的 . 
证 明 : 泊 松 随机 变量 了 的 期 望 值 是 A. 
解 ” 由 定义 4.4， 
c Ave 
E(Y) = 2,00 = > r 
H F y 20, 所 以 这 个 级 数 的 第 一 项 等 于 0, 因此 ， 
_ © ye _ Ae? _ < À Ale 
EOD = > y > (y-1)! ` > (y-1)! 
把 常数 入 从 和 式 中 提出 来 , 并 令 Z= (Y-1), 我 们 得 
- iA - 
E(Y) - AY ae = A pC) 
其 中 Z 是 均值 为 A 的 泊 松 随机 变量 , 因此 ， 


E(Y) =à $p) =AÀ(1) 2A 





应 用 练习 国航 空 航天 局 , 2004 年 ). 当 -~- 颗 行星 在 恒星 前 面 


网 址 ( www. math. beit. ca) 上 提供 了 统计 学 在 机 械 "FATE JACEMTT ; R 


见 行 .2 ) 行 
工程 中 的 实际 应 用 下 面 是 泪 松 分 布 应 用 ,一 郑 涂 MOTA S ARR 100 Qo Hr 
每 4m 个 设 一 个 , m Tue 
BRATIA mA O 8 TR, 假设 一 个 质量 控 RIKARIR H. 这 次 任务 希望 每 
制 工程 师 从 一 卷 220 m 长 的 电线 中 抽出 4 m MEFE 


、 10 000 颗 恒 星 中 发 现 有 5.6 颗 太 阳 系 以 外 的 行星 . 
本 , 如 果 样 本 中 没有 发 现形 疯 , 工程 师 接受 整 卷 电 如 果 10 000 颗 恒星 中 太阳 系 以 外 行星 凌 日 的 数量 


A E ERAMEAAIBURISAUPT 你 求 这 个 概率 。 服从》 = 5.6 的 治 检 分布 ， 册 看 见 超过 10 次 行星 
时 需要 有 什么 假定 ? 日 的 概率 是 多 少 ? 


(2005 年 6 月 ) 在 韩国 , 司机 每 天 非 家 旅 的 数量 可 次 事故 ( Statistical Abstract of the United States; 


Hl A 21.15 的 泊 松 分 布 来 模拟 . 2005) ,假设 每 月 事故 数量 了 的 概率 分 布 可 以 近似 
a. 随机 挑选 一 位 韩国 司机 ,他 每 天 非 家 旅 的 次 数 为 泊 松 概率 分 布 . 
不 超过 2 次 的 概率 是 多 少 ? a. 在 任何 指定 的 一 个 月 内 不 发 生 事故 的 概率 是 
b. 求 韩国 司机 每 天 非 家 旅 次 数 的 方差 . 多 少 ? 
c. 利用 b 的 信息 求 司机 每 天 非 家 旅 不 可 能 超过 的 b. 在 任何 指定 的 一 个 月 内 发 生 一 次 事故 的 概率 是 
次 数 . ` 多 少 ? 


4.69 军 见 的 行星 凌 日 .“ 金 星 凌 日 ”描述 了 一 个 罕 c. 求 E(Y) 和 了 的 标准 差 . 
见 的 天 文 事件 , 即 从 地 球 上 看 , 金星 好 像 从 太阳 前 4.71. 深 吃水 船 事 故 . 新 墨西哥 大 学 的 工程 师 通 过 对 
面 经 过 , 最 近 一 次 “金星 凌 日 ”发生 在 1882 年 , ( 美 挂 美 国旗 的 深 吃 水 船 3 年 的 试验 ， 用 泊 松 随机 变量 
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> 


了 作为 严重 伤亡 事故 (死亡 或 失踪 ) 次 数 的 模型 . 研 

SEA bi fiii ECY) 是 0.03 (Management Science, 

1999 £1 jJ). 

a. 求 了 的 方差 . 

b. 讨论 使 研究 人 员 的 泊 松 假定 合理 的 条 件 . 

c. 3 年 之 内 挂 美 国旗 的 深 吃 水 船 没 有 伤亡 人 员 的 
概率 是 多 少 ? 


-72 SC 3k. 环保 协会 (EPA) 限 制 工厂 气体 排 


放 中 毛 乙 烯 的 排 量 不 能 超过 百 万 分 之 十 , 假定 某 
个 工厂 氯 乙 烯 平均 排放 是 百 万 分 之 四 , 假设 空气 
样本 中 氯 乙 烯 的 百 万 分 之 含量 了 服从 泊 松 概率 
分 布 . 

a. 这 个 工厂 了 的 标准 差 是 多 少 ? 

b， 这 个 工 三 空气 样本 有 可 能 含有 超过 EPA 限度 的 

了 值 吗 ? 解释 为 什么 ? 
e. 讨论 使 泊 松 假设 合理 的 条 件 . 


S79 小 行星 光谱 图 . 参考 练习 2. 12, Science ( 1993 


年 4 月 ) 关 于 主 带 小 行星 的 光谱 性 质 的 研究 , 研究 

人 员 揭 示 每 个 小 行星 平均 有 2.5 次 独立 的 谱 像 

曝光 . 

a. 假设 为 一 个 泊 松 分 布 , 求 观测 主 带 小 行星 时 恰 
有 一 次 独立 谱 像 曝光 的 概率 是 多 少 ? 

b. 假设 为 一 个 泊 松 分 布 , 求 观测 主 带 小 行星 时 最 
多 有 两 次 独立 谱 像 曝光 的 概率 是 多 少 ? 

e. 观测 主 带 小 行星 时 , 你 期 望 观测 到 7 次 或 更 多 
独立 谱 像 曝光 吗 ? 解释 原因 . 

74 ”加拿大 严重 的 岩石 甬 落 . 对 过 去 的 5 000 年 

加 拿 大 落 矶 山脉 天 然 岩 质 边 坡 运动 的 研究 表明 ， 

每 100 km’ 严重 的 岩石 崩落 数量 的 期 望 值 为 

1.57 (Canadian Geotechnical Journal, 1985 年 11 

月 ). 

a. 求 在 过 去 5 000 年 , 加 拿 大 落 矶 山脉 每 100 km? 
严重 岩石 崩落 数量 了 的 均值 和 标准 差 . 

b. 在 过 去 5000 年 , 每 100 km 观测 到 3 次 以 上 严 
重 岩 石 崩落 的 概率 是 多 少 ? 

75 激光 反射 的 噪声 . 半 影 成 像 是 一 项 原子 核 工 

程 师 用 于 为 释放 高 能 光子 物体 的 成 像 技 术 , IEICE 

Transactions on Information & Systems ( 2005 年 4 月 ) 

人 研究 者 证 明了 半 影 成 像 总 是 被 噪声 减弱 ,其 中 单 

位 时 间 内 噪声 事件 发 生 的 数量 了 服从 均值 为 A 的 





泊 松 过 程 . 半 影 成 像 的 信 品 比 (SNR) 定 义 为 SNR = 
a/o, 其 中 和 og 分别 是 噪声 过 程 的 均值 和 标准 
差 . 证 明 : 了 的 SNR 是 VA. 


. 76 环境 空气 质量 . 为 了 尽 可 能 控制 空气 污染 ， 环 


境 保护 协会 (EPA) 已 经 制定 了 国家 环境 空气 质量 
标准 . 目前 ，EPA 对 空气 中 臭氧 水 平 的 限制 是 亿 分 
之 十 二 (pphm). 一 项 研究 是 测试 得 克 萨 斯 的 体 斯 
顿 日 臭氧 水 平 的 长 期 趋势 ?, 感 兴趣 的 变量 是 一 年 
中 臭氧 水 平 超过 EPA 12pphm 阐 值 的 天 数 Y. 一 年 
中 超 阔 值 的 平均 次 数 估计 为 18, 假设 了 的 概率 分 
布 可 以 用 泊 松 分 布 作 为 模型 . 

a. 计算 P(Y«20). 

b. 计算 P(5<Y=10). 

c. 估计 了 的 标准 差 , 你 期 望 在 某 一 年 中 了 落 入 什 
么 范围 ? 

d. 研究 表明 在 过 去 的 7 年 中 超过 EPA 阔 值 水 平 的 
次 数 呈 下 降 趋势 . 过 去 的 6 年 中 , 了 的 观测 值 是 
24,22,20,15,14 和 16, 解释 为 什么 这 个 趋势 引 
起 了 人 们 对 泊 松 分 布 作 了 的 模型 的 有 效 性 的 怀 
颖 (提示 : 考虑 泊 松 随机 变量 的 第 三 条 特征 ). 


S776 意外 的 原子 核 紧 急 停 堆 . 原子 核 工业 已 经 尽 最 


大 的 努力 显著 减少 了 在 核反应 中 意外 的 快速 紧急 

关闭 , 称 为 紧急 停 堆 的 次 数 . 10 年 前 , 美国 核反应 

单位 平均 每 年 4 次 意外 紧急 停 堆 ( 见 练习 2.67)， 

假设 每 年 核反应 单位 发 生意 外 紧急 停 堆 的 次 数 近 

似 服 从 泊 松 分 布 . 

a. 如 果 均 值 不 变 , 计算 核反应 单位 这 年 之 内 有 10 
次 或 更 多 次 意外 紧急 停 堆 的 概率 . 

b. 假设 一 个 随机 挑选 的 核反应 堆 这 年 之 中 实际 上 
经 历 了 10 次 或 10 次 以 上 意外 紧急 停 堆 , 关于 
意外 紧急 停 堆 的 年 平均 次 数 你 能 推断 出 什么 ? 
解释 原因 . 


理论 练习 
4.78 ”对 于 一 个 泊 松 随机 变量 Y, 证明: 


a 0=p(y) xl. 


b. 2.00) -1. 
c. E(Y) =A +A. 
(提示 : 首先 根据 下 面 事实 得 到 E[Y(Y-1)] = 


Q Shively, Thomas S. “ An analysis of the trend in ozone using nonhomogeneous Poisson processes. " Paper presented at annual 


meeting of the American Statistical Association, Anaheim, Calif. , Aug. 1990. 














126 第 4 £ 
, < "E 然后 再 利用 结论 ELY(Y - 1) ] = EY? - E(Y)..) 
AELY(Y-D] = 2601) 4.79 ”对 于 一 个 泊 松 随机 变量 Y, 证 明 : o° = À. 
Š et A (提示 : 利用 练习 4.78 的 结论 和 定理 4.4. ) 
> z! 


“4. 11 EMERARA 


随机 变量 的 矩 可 以 用 来 完全 地 描述 它 的 概率 分 布 . 
定义 4.7 随机 变量 了 的 无 阶 原点 矩 用 符号 1 表示 , 定义 为 ; 
py =E(Y*) (kz1,2, =) 
XEX 4.8 Mox X Y 85 k Wirriy SE J 413 u 表示 ， 定 义 为 ， 
iy SEL CY -u)*] 
我 们 已 经 学 过 了 随机 变量 的 两 个 重要 矩 , 随机 变量 的 均值 是 =, NÉ m = ez， 其 他 的 原点 


的 概率 分 布 . 例如 , 设 式 和 了 是 两 个 离散 随机 变量 ， 分 别 具 有 原点 矩 As， ub. Uhr UB a.u, 
4，…， 如 果 所 有 对 应 的 矩 都 相等 ， 即 如 果 pi, mut. ub. uo, E, ERIT BERCROR 25 E p GO 和 和 
P(7y) 是 相同 的 . 
离散 随机 变量 的 各 阶 矩 可 由 定义 4.7 直接 求 出 ， 然而 如 例 4. 11 和 例 4. 20 所 示 , ok ECY)RI 
ECY!) 等 必须 求 和 , 这 可 能 是 麻烦 的 ， 有 时 可 以 应 用 随机 变量 的 矩 母 函数 降低 求 随机 变量 矩 的 
难度 . 
定义 4.9 一 个 离散 随机 变量 Y AERAR MOLA: 
m(t) = E(e!Y) 
离散 随机 变量 的 矩 母 函 数 仅仅 是 一 个 把 各 阶 矩 压缩 成 一 个 公式 的 数学 表达 式 . 要 想 由 这 个 公式 
求 出 具体 的 和 矩 ,由 定义 4. 9, 我 们 首先 注意 ， | 
tY _ t 
E(e) = 2 epo) 
其 中 





2 3 4 
etse UD 00 + t) T 


3! 4! 
然后 , 如 果 对 i=1, 2,3, 4, …, u; 是 有 限 的 ， 


2 3 
nO) SED Bop) Blt BÉO, oy 


Hy 
2 3 p 
= »IEO + typ(y) +p pO) + app) +] 
现在 应 用 定理 4.2 和 定理 4. 3 得 到 
2 
m(t) = 270 up ELO 4 


然而 , 由 定义 4.7， 2,700 =, 因此， 


离散 随机 变量 727 





og B 
m(t) =l +u tz? tz + 
这 说 明 如 果 我 们 有 了 一 个 随机 变量 的 矩 母 函数 , 并 且 能 把 它 展 开 成 二 的 每 级 数 ， 即 
m(t) 21*a,t*aj£? +a 4 --- 
那么 , nA t 的 系数 是 Ai =p, C RRE 721, 一 般 地 , t RAE ut 
如 果 我 们 不 能 轻易 地 把 m( t) RFR c RRA, 我 们 可 以 通过 m(t) 关 于 + 的 导数 , MAJA LAE 
于 0, 求 出 y 853. 因此 ， 





[Oru Da, E uus 
-( thi Ty Mo 3143 ) 


41-0, 我 们 得 


R m(i) 对 1 的 二 阶 导数 得 


d'm(t) _ , 31! 
ab (o +m yr +=) 
然后 令 1=0, 我 们 得 
d^m(t) ; ， 
“ae | 7064040) zu, 





定理 4.5 LES T 0s] HE BERE m CO R IB ua. 
定理 4.5 车 m(t) 硝 在 , Rl k BF 8 RAE + 








A T VLBHAB REPRROBCBS zz Fd, 考虑 下 面 的 例子 . 
导出 二 项 随机 变量 了 的 和 矩 母 函 数 . 
8B ABRE: 
= E tY = : ty = : tyfn yan = - n et Yn-y 
m(t) (e) >° p(y) >° jr X ()0 Vq 
现在 我 们 回忆 二 项 式 定 理 ( 见 练习 4. 36) 
a+b)" = ; npa 
(a +b) > (°) 
4 a-pe', b=g 得 到 想 要 的 结果 : 
m(t) = (pe! +q)" 
URGA AH 2EFB4 5 导出 二 项 随机 变量 的 Hi =u X us. 
解 ” 由 定理 4.5， 
M1 = = ur (pet +q)" (pe!) , 


然而 e? =1, 所 以 





„o ZPE +q)" e) 
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uA =u -n(p*q)""lpzn(1)"*!pznp 
类 似 地 ， 
, d^m(t) d i t n-l | Im 
Ma = gp | QUU alte £07] i-o 


- np| e'(n - 1) (pe! +q)" ?pe' + (pe! +q)" let] 





t=0 
=np[(1)(n-1)(1)p+(1)(1)]=np[(n-1)p+1] 
=np(np~p+1) =np(np +q) =n2p? + npq 
利用 例 4. 22 的 结果 , 再 由 定理 4.4 导出 二 项 随机 变量 的 方差 
解 由 定理 4.4， 
a? = E(Y2) -p =u, - (u) )2 
把 例 4. 22 GR HH I u 和 Ai =j 的 值 代入 
a? = n°p? « npg — (np)? = npq 
94.22 和 例 4. 23 说 明 , 用 和 矩 母 函数 求 二 项 随机 变量 的 ji fly 比 用 二 项 公式 分 别 求 由 = 
ECY) Ru, 2 ECY*) 容易 . 为 了 求 mO), 你 只 须 对 一 个 级 数 求 和 . 对 其 他 的 许多 随机 变量 , 但 并 非 对 
所 有 随机 变量 , REER p) 和 js 最 好 的 方法 . i 
本 章 最 后 快速 回顾 中 的 重要 公式 归纳 了 某 些 有 用 的 离散 随机 变量 的 概率 分 布 、 均 值 | E 
母 函 数 . 





理论 练习 然后 注意 求 和 的 量 是 一 个 参数 为 Ae: 的 泊 松 概 
_ 率 . ) 

4.80 导出 泊 松 随机 变量 了 的 失 母 画 数 (E Z, 
BOR AE RE PLAE RE A GEE: a 利用 练习 4. 80 的 结果 导出 泊 松 分 布 的 均值 和 

写 出 xx 

m(t) = E(e”) = ye 4.82 FURIAEREBUR ICE Ly ee NAKEN RR 

. 7 , 导出 几何 随机 变量 的 均值 和 方差 

er er PHOT 
e > y! = ee > yl 

快速 回顾 

重要 公式 


注 : 标 有 ( * ) 号 的 公式 来 自 本 章 选 学 的 4. 11 节 . 
oo 
随机 变量 





p(y) u a? * m(t) 
离散 (一 般 ) ”p(y) E(Y)*Xy(y) E(Y)-,2 
伯 努 利 p(y) =P9g 7 其 中 9=1-p,7y=0,1 p pq pe' +q 
二 项 po) «(Tre 其 中 g=1-p, y=0, 1, …,n np npq (pe' +q)" 
OG) nr r(N -r)n(N -n) 
JL p(y) = W CONN- 未 给 出 


(a) 





离散 随机 变量 729 

















( 续 ) 
随机 变量 — p(y) A o° *m(i) 
-à 
泊 松 p) = y=1,2, À À eot 
1 1-p — pe ool 
= -1 二 ... 一 一 
几何 p(y) =P(LE-P)7 y=1,2, p = 1-(1-p)e 
s LAYIN uno uL 本 ES r(1 - p) pe r 
RZE pp-(Tu)sa-me y=r,r+1, r o (aa) 
! 
多 项 PC Yn. `, Yk) ET Lr y LG? (p ?* (p)? npi np; (1l —p;) 未 给 出 





符号 汇集 
Di 一 一 
符 sc 读 法 说 — HJ 
p(y) 随机 变量 了 的 概率 分 布 
ECY) Y 的 期 望 值 的 概率 分 布 的 平均 值 
S 表示 “成 功 ”的 伯 努 利 试 验 结果 
F : 表示 “失败 "的 伯 努 利 试验 结果 
p 伯 努 利 试验 中 成 功 (3) 的 概率 
q 伯 努 利 试验 中 失败 ( F) 的 概率 ,其 中 9 =1-p 
À lambda 泊 松 随机 变量 的 事件 平均 (或 期 望 ) 个 数 
e 用 于 泊 松 概率 分 布 中 的 一 个 常数 ,其 中 e =2. 718 28… 
m(t) ERER AY 
-全 
本 章 总 结 提示 
° 离散 随机 变量 仅 能 取 可 数 个 值 . 


离散 概率 分 布 要 求 : p(y) 20, HEp(y) = 1. 

离散 随机 变量 的 概率 模型 : 伯 努 利 、 二 项 、 多 项 、 负 二 项 、 几 何 、 超 几何 及 泊 松 . 

伯 努 利 随 机 变量 的 特征 : (1) 在 一 次 试验 中 有 两 个 互 斥 的 结果 : S 和 F; (2) 结果 是 完备 的 ， 
(3) P(S) =p, P(F) =q, 其 中 p+g=1. 

一 项 随机 变量 的 特征 : (1) n 次 相同 的 试验 ; (2) 每 次 试验 有 两 个 可 能 的 结果 : S 和 F; 
(3) 每 次 试验 P(S) =p, P(F) =q 保持 不 变 ; (4) 试验 是 独立 的 ; (5) 了 = 次 试验 中 5 的 次 数 . 
多 项 随机 变量 的 特征 : (1) n 次 相同 的 试验 ; (2) 每 次 试验 有 上 个 可 能 的 结果 ; (3) 每 次 试验 
个 结果 的 概率 保持 不 变 ; (4) 试验 是 独立 的 ; (5) Yi, Yo, e, Y, 分 别 表示 大 种 结果 出 现 的 
次 数 . 

负 一 项 随机 变量 的 特征 : (1) 相同 的 试验 ; (2) 每 次 试验 有 两 个 可 能 的 结果 (S A F); 
(3) 每 次 试验 P(S) =p, PCF) =q 保持 不 变 ; (4) 试验 是 独立 的 ; (5) 了 = 直至 观测 到 第 次 
S 时 试验 的 次 数 . 

几何 随机 变量 的 特征 : (1) 相同 的 试验 ; (2) 每 次 试验 有 两 个 可 能 的 结果 S 和 F; (3) 每 次 
试验 P(S) =p, P(F) =q 保持 不 变 ; (4) 试验 是 独立 的 ; (5) 了 = 直至 观测 到 第 1 次 S 时 试验 
的 次 数 . ' 
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。 超 几何 随机 变量 的 特征 : (1) JN 个 元 素 的 集合 中 无 放 回 地 抽取 个 元 素 , 其 中 包括 r 个 8 
和 (CN - r) F; (2) 了 =n 次 试验 中 5 的 次 数 . 

。 泊 松 随 机 变量 的 特征 : (1) Y= 单位 时 间 、 面积 或 体积 内 稀有 事件 8 发 生 的 次 数 ; (2) 对 所 有 
单位 P(5) 保 持 不 变 ; (3) 一 个 单位 的 了 值 与 其 他 单位 的 了 值 是 独立 的 . 


补充 练习 


4.83 钢板 生产 . 参考 练习 3. 20 介绍 的 马自达 汽车 


公司 钢板 使 用 的 研究 Metal Progress(1986 年 5 月 ), 
下 表 列 出 了 8 种 钢板 类 型 及 其 在 生产 中 使 用 的 百 
分 数 , 假设 从 马自达 生产 使 用 的 626 片 钢板 中 随机 
地 抽取 (不 放 回 )3 片 , 求 样本 中 冷 轧 钢板 数量 了 的 
概率 分 布 并 作 图 . 





钢板 类 型 使 用 的 百分数 
冷 轧 、 普 通 强 度 、 没 有 涂 层 27 
冷 轧 、 高 强度 、 没 有 涂 层 12 
冷 轧 、 普 通 强度 、 有 涂 层 30 
冷 轧 、 高 强度 、 有 涂 层 15 
热 轧 、 普 通 强度 、 没 有 涂 层 8 
热 轧 、 高 强度 、 没 有 涂 层 5 
热 轧 、 普 通 强 度 、 有 涂 层 3 
热 轧 、 高 强度 、 有 涂 层 0 
合计 100 


——————————————Á———À—— ÉL 
资料 来 源 : Chandler, H. E. “Materials trends at Mazda Motor 
Corporation. " Metal Progress, Vol. 129, No. 6, May 1986, 
p. 57( 图 3). 


.04 壁虎 的 休息 率 . 动物 学 家 发 现 动物 花 大 量 的 时 
间 用 来 休息 , 尽管 这 些 休息 时 间 具 有 功能 上 的 重 
要 性 (例如 , 肉食 动物 是 等 待 它们 的 猎物 ), 由 于 无 
法 界定 熟睡 时 间 , 佛蒙特 大 学 的 研究 人 员 估 计 了 
各 种 物种 用 在 休息 时 间 的 百分数 ( National Wildlife , 
1993 年 8-9 月 ). 例如 , 在 任何 给 定 的 时 间 里 , MEE 
壁虎 休息 的 概率 为 0. 95. 

a. 由 20 只 峻 性 壁虎 的 随机 样本 中 , 在 任何 给 定 的 
时 间 至 少 有 15 只 在 休息 的 概率 是 多 少 ? 

b. 由 20 只 内 性 壁虎 的 随机 样本 中 , 在 任何 给 定 的 
时 间 不 到 10 只 在 休息 的 概率 是 多 少 ? 

c. 由 200 只 上 峻 性 壁虎 的 随机 样本 中 , 在 任何 给 定 
的 时 间 你 期 望 观测 到 少 于 190 只 在 休息 吗 ? 解 
释 原因 . 

.85 海产 品 中 的 冬 ，Consumer Reports (1992 年 2 
月 ) 在 纽约 市 和 芝加哥 的 超市 里 发 现 海产 品 普遍 有 
污染 并 误 贴 标签 . 研究 显示 了 惊人 的 统计 结果 : 出 


+ 


4. 


售 刀 鱼 的 40% REEE T ftJ 125 t: 65 g Ja 

《FDA) 规 定 的 最 大 量 , 对 3 条 刀鱼 的 随机 样本 , 求 

下 面 的 概率 : 

a. 所 有 3 条 刀鱼 的 汞 含量 全 部 超过 了 FDA 的 最 
大 值 . 

b. 恰 有 1 条 刀鱼 汞 含量 超过 了 FDA 的 最 大 值 . 

c. 最 多 有 1 条 刀鱼 含量 超过 了 FDA 的 最 大 值 . 


.86 肠胃 炎 爆 发 . 1981 年 3 月 , 在 科罗拉多 爆发 了 


水 生 非 细菌 性 肠胃 炎 ， 是 一 个 污水 治理 厂 长 期 缺 
乏 过 滤 并 出 现 故障 导致 的 . 为 确定 在 流行 期 间 肠 胃 
炎 病 发 生 是 否 与 水 的 消耗 量 有 关 而 进行 了 研究 
( American Water Works Journal, 1986 年 1 月 ). 对 40 
名 在 疾病 流行 期 间 有 肠胃 炎症 状 居民 的 样本 , 按 8 
dE RDKIRIBI H IEEE, 对 家 庭 进 行 了 电话 调查 . 


水 日 消耗 量 ( 按 8 盎司 水 杯 计 量 ) 
3-4 5 及 以 上 总 计 





0 1-2 





有 症状 响 

应 者 人 数 

资料 来 源 : Hopkins, R. S. , et. al. “ Gastroenteritis: Case 
study of a Colorado outbreak. " Journal American Water Works 
Association, Vol. 78, No. 1, Jan. 1986, p. 42. Table 1. 
Copyright©) 1986, American Water Works Association. Re- 


printed with permission. 


a. 如果 有 症状 响应 者 的 数量 与 日 耗 水 量 无 关 , 为 
表 中 所 示 4 种 类 型 指派 概率 . 
b. 利用 a 的 信息 , 求 观测 到 表 中 所 示 样 本 的 概率 . 


11 13 10 40 


.87 太阳 能 加 热 板 的 寿命 . 工程 开发 试验 室 进行 试 


验 以 研究 新 型 的 太阳 能 加 热 板 的 寿命 . 设计 的 新 型 

太阳 能 加 热 板 至 少 有 5 年 使 用 寿命 的 概率 是 p = 

0.95, 由 20 个 新 型 太阳 能 加 热 板 组 成 一 个 随机 样 

7k, 记录 它们 的 使 用 寿命 . 

a. RA 18 个 太阳 能 加 热 板 使 用 寿命 至 少 为 5 年 的 
概率 是 多 少 ? 

b. 最 多 有 10 个 太阳 能 加 热 板 使 用 寿命 至 少 有 5 年 
的 概率 是 多 少 ? 

c. 如 果 20 个 太阳 能 加 热 板 中 仅 有 10 个 使 用 寿命 
至 少 为 5 E, 请 你 推断 p 的 真 值 是 多 少 ? 

88 涡轮 蒸汽 机 发 电厂 . 国家 卫生 设备 部 门 聘用 了 


SKEIE E 
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5 名 机 械 工程 师 , 其 中 2 名 有 设计 涡轮 蒸汽 机 发 电 

三 的 经 验 . 请 你 从 5 名 工程 师 中 随机 地 挑选 2 名 去 

从 事 一 个 新 发 电厂 的 设计 项 目 . 

a 你 选中 了 有 设计 涡轮 蒸汽 机 发 电厂 经 验 的 那 2 
名 工程 师 的 概率 是 多 少 ? 

b. 你 至 少 选中 1 名 有 这 种 经 验 的 工程 师 的 概率 是 
多 少 ? 

.89 铁道 系统 关闭 . 欠 发 达 国 家 历经 了 人 口 的 快速 
增长 后 , 他 们 的 大 城市 常 面临 严重 的 交通 控制 问 
ER, 交通 工程 师 认 为 高 架 铁道 系统 能 够 提供 一 个 
可 行 的 解决 方法 , 研究 表明 , 某 一 国家 高 架 铁 道 系 
统 因 维修 而 关闭 的 次 数 平均 是 每 月 6. 5 W. 

a. 求 这 个 国家 下 个 月 至 少 关闭 5 次 高 架 铁 道 系统 
的 概率 . 
b. 求 下 个 月 恰好 关闭 4 次 的 概率 . 

.90 地 党 的 磁化 时 代 . 在 深海 层 发 现 了 重要 的 稀有 
金属 鳃 的 大 量 结核 (American Scientist, 1976 年 9-10 
月 ). 为 了 研究 海洋 层 地 壳 的 磁化 年 代 与 锰 含 量 的 
关系 , 选 出 了 几 百 个 锰 结 核 并 确定 每 个 结核 的 位 
BOE, 已 转换 成 概率 的 数据 见 下 表 . 
m 





年 R W 3x 
渐 新 世 0.20 
始 新 世 0.15 
古 新 世 0.20 
白垩 纪 0.30 
侏 罗 纪 0. 10 
其 他 0. 05 


合计 1. 00 

— “ O 

a 在 海洋 层 发 现 的 10 个 锰 结 核 样本 中 , 求 1 个 来 
自 渐 新 世 , 2 个 来 自 始 新 世 , 2 个 来 自古 新 世 , 4 
个 来 自白 垩 纪 , 1 个 来 自 侏 罗 纪 ,没有 来 自 其 他 
地 质 年 代 的 概率 . 

b. 在 海洋 层 找到 的 100 个 鳃 结核 的 未 来 样本 中 ， 
求 来 自 始 新 世 年 代 的 样品 个 数 的 均值 和 方差 ， 
你 期 望 这 个 数落 人 什么 范围 内 ? 

91. 测试 阴极 射线 管 . 假设 你 购买 了 一 小 批 阴 极 射 
ZUR (CRT) 作为 计算 机 终端 设备 , 由 于 测试 -个 
CRT 费用 很 高 , 所 以 希望 测试 这 批 中 的 CRT 样本 ， 
而 不 是 这 批 中 的 每 个 CRT, 这 种 抽样 计划 是 基于 超 
几何 概率 分 布 . 例如 , 假设 每 批 包 括 7 个 CRT, 决 
定 每 批 抽 出 3 个 CRT 作为 样本 ， 如 果 在 样本 中 你 
发 现 测 到 1 个 或 1 个 以 上 的 次 品 , 你 就 拒绝 这 


4. 


批 CRT. 

a. 如 果 这 批 产品 中 包括 1 个 不 合格 的 CRT, 你 将 
接收 这 批 产品 的 概率 是 多 少 ? 

b. 如果 包 括 3 个 不 合格 的 CRT, 你 将 接收 这 批 产 
品 的 概率 是 多 少 ? 

92 道路 交叉 口 的 使 用 . 随机 变量 了 表示 在 规定 的 

时 段 内 到 达 一 个 道路 交叉 口 的 汽车 数量 , 常常 ( 近 

似 ) 服 从 泊 松 概率 分 布 . 当 平均 到 达 率 À 已 知 时 ， 

泊 松 概率 分 布 可 以 帮助 交通 工程 师 设计 交通 控制 

系统 . 假设 你 估计 在 道路 交叉 口 每 分 钟 平 均 到 达 的 

数量 是 每 分 钟 1 辆 车 ， 

a. 在 给 定 的 1 分 钟 内 , 到 达 的 数量 是 3 或 3 辆 以 上 
的 概率 是 多 少 ? 

b. 你 能 让 工程 师 确信 每 分 钟 到 达 的 数量 很 少 超过 
每 分 钟 3 辆 吗 ? 


O98 五 油 勘 探 研究 . 参考 练习 3. 83 讨论 的 石油 勘 


探 研 究 ，Kinchen( 1986) 举 了 一 个 例子 , 其 中 为 一 次 
石油 探测 调拨 50 000 美元 勘探 预算 . 井 可 能 是 一 个 
干 井 或 50 000 桶 、100 000 桶 、500 000 桶 或 1 000 000 
桶 油 ,概率 和 货币 结果 见 下 表 , 令 了 表示 一 次 石油 
勘探 的 货币 价值 , REVA, 给 出 一 个 包含 
95% 了 的 观测 值 区 间 . 


可 能 结果 货币 结果 





Cf) (美元 ) W 这 
FH -50 000 0. 60 
50 000 -20 000 0. 10 
100 000 30 000 0. 15 
500 000 430 000 0. 10 
1 000 000 950 000 0. 05 


资料 来 源 : Kinchen, A. L., “ Projected outcomes of explora- 
tion programs based on current program status and the impact 
of prospects under consideration. " Journal of Petroleum Tech- 
nology, Vol. 38, No. 4, April 1986, p. 462 ( & 1). 


.94 参考 练习 4.93, 假设 有 100 000 美元 的 勘探 预 


算 被 2 次 同样 且 独 立 的 石油 勘探 平分 . 

a TX OR 2 次 石油 勘探 货币 价值 之 和 , R X it 
概率 分 布 . 

b. 求 E(X) 和 ,与 a 中 的 结果 进行 比较 . 

e. 在 2 次 石油 勘探 中 加 倍 投资 100 000 美元 的 概率 
是 多 少 ? 将 此 概率 与 练习 4 93 中 一 次 石油 勘探 
投资 加 倍 50 000 美元 的 概率 比较 . 

d. 在 2 次 石油 勘探 中 ,“ 投 机 者 破产 ”( 即 2 H + 
并 ) 的 概率 是 多 少 ? 将 此 与 练习 4. 93 的 一 次 石 
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4. 


+ 


油 勘探 “投机 者 破产 "的 概率 进行 比较 . 

95 光学 扫描 仪 失误 . 认 读 价格 的 光学 扫描 仪 生产 

商 宣称 , 由 于 误 读 了 产品 标签 上 的 “条 形 码 ”, 任何 

产品 的 价格 被 误 读 的 概率 是 0. 001. 在 超市 里 安装 

打 描 仪 时 , 经 理 要 测试 它 的 性 能 . 令 了 表示 直到 第 

一 次 观测 到 读 错 价格 时 试验 次 数 ( 即 扫描 仪 读 出 价 

格 个 数 ). 

a. 如果 生产 商 的 宣称 是 正确 的 , 求 了 的 概率 分 布 
(假设 试验 是 独立 事件 ). 

b. 如 果 生 产 商 的 宣称 是 正确 的 ， 直到 读 完 第 5 个 
价格 之 后 扫描 仪 没 有 出 现 读 错 价 格 的 概率 是 
多 少 ? 

e. 如 果实 际 上 第 3 个 价格 被 误 读 了 , 对 生产 商 的 
宣称 你 能 做 出 什么 推断 ? 解释 原因 . 


.96 第 二 次 世界 大 战 中 雷达 的 使 用 . 在 二 战 期 间 当 


雷达 第 一 次 引进 时 , 对 于 屏幕 操控 者 来 说 , 很 难 把 
静止 障碍 物 的 可 视 信 号 与 真正 敌 机 的 可 视 信号 区 
分 出 来 , 虽然 操控 者 不 想 听 到 不 必要 的 警报 声 , 但 
是 不 提醒 御 防 可 能 造成 严重 的 后 果 , 记录 显示 所 
有 观测 到 的 可 视 信 号 中 60% 表示 敌人 的 飞机 . 假设 
在 一 次 实际 围攻 中 , 5 个 可 视 信 号 及 时 处 于 屏幕 上 
5 个 不 同 的 点 , 雷达 操控 者 提醒 每 个 场合 防御 , 假 
设 事件 是 独立 的 , 计算 下 列 每 个 事件 的 概率 . 
a. 雷达 操控 者 对 所 有 5 个 场合 都 作出 了 正确 的 
决定 . 
b 雷达 操控 者 对 至 少 3 个 场合 作出 了 正确 的 决定 . 
e. 雷达 操控 者 5 次 都 不 正确 (所 以 听 了 5 次 假 的 警 
报 ). 


-97 加速 道 的 作用 . 对 以 色 列 超速 主干 道 的 加 速 道 


〈 即 并 道 臣 道 ) 上 车 流 移动 特征 的 研究 发 现 每 6 辆 

汽车 中 有 1 辆 在 汇 人 通行 之 前 使 用 了 不 到 加 速 道 

的 1⁄3 ( Journal of Transportation Engineering, 1985 

年 11 R), 假设 我 们 监视 将 进入 加 速 道 的 以 后 5 辆 

汽车 的 汇合 位 置 . 

a. 没有 一 辆 汽车 使 用 少 于 加 速 道 的 1⁄3 的 概率 是 
多 少 ? 

b. 恰好 有 2 辆 汽车 使 用 少 于 加 速 道 /3 的 概率 是 
多 少 ? 


.98 加速 道 的 作用 ( 续 ). 参考 练习 4.97, 假设 每 


分 钟 使 用 加 速 道 的 汽车 平均 数量 是 1.1. 

a 在 下 一 分 钟 有 超过 2 辆 汽车 使 用 加 速 道 的 概率 
是 多 少 ? 

b. 在 下 一 分 钟 恰 有 3 辆 汽车 使 用 加 速 道 的 概率 是 
多 少 ? 


4. 


+ 
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99 工业 机 器 人 故障 . 当今 , 大 多 数 工 业 机 器 人 都 

设计 成 由 微 处 理 机 来 运行 . 这 种 计算 机 化 的 机 器 人 

在 任何 一 轮 8 h 的 工作 时 间 内 出 现 故 障 的 概率 为 

0.2. 求 出 现 2 次 故障 之 前 机 器 人 运行 了 至 多 5 轮 

的 概率 . 

“一 个 小 概率 事件 的 充分 延 

续 会 使 特定 结果 是 必然 的 "，A + J- Coale 在 Popu- 

lation and Development Review (1985 年 9 H ) 写 道 . 

Coale 所 指 的 “必然 "事件 是 核 战争 , 专家 认为 在 指 

定 的 一 年 中 核 战 争 爆 发 的 概率 很 小 , 但 不 是 0. 那 

么 根据 Coale,“ 经 过 几 百 年 , 核 战 争 实 际 上 成 为 必 

然 , "假设 在 指定 的 一 年 中 核 战 争 爆发 的 概率 仅 

为 0.01. 

.在 随后 的 5 年 中 核 战争 爆发 的 概率 是 多 少 ? 

.在 随后 的 10 年 核 战争 爆发 的 概率 是 多 少 ? 

- 在 随后 的 15 年 中 核 战争 爆发 的 概率 是 多 少 ? 

. 在 随后 的 20 年 中 核 战争 爆发 的 概率 是 多 少 ? 

回答 a ~ d 必须 作出 什么 假定 , 这 个 假定 是 真 的 

可 能 性 有 多 大 ? 

101 听觉 神经 纤维 . 听觉 神经 纤维 的 放电 (或 反 

应 ) 率 ( 记 为 噪声 爆发 的 每 200 ms 脉冲 数 ) 用 来 度 

量 听觉 神 经 中 声音 刺激 的 效果 . 对 猫 的 听觉 神经 纤 

维 反 应 率 的 经 验 研究 结果 是 平均 15 脉冲 /毫秒 

( Journal of the Acoustical Society of America , 1986 年 

2 月 ). 令 了 表示 研究 中 随机 挑 出 猫 的 听觉 神经 纤 

维 的 反应 率 . 

a. 如 果 了 近似 为 一 个 泊 松 随机 变量 , 求 了 的 均值 
和 标准 差 . 

b. 假设 了 是 泊 松 随机 变量 , 了 超过 27 脉冲 /毫秒 的 
概率 大 约 是 多 少 ? 

c. 研究 中 发 现 了 的 方差 远 小 于 15 脉冲 /毫秒 , 期 
望 了 服从 泊 松 过 程 合理 吗 ?” 这 将 如 何 影响 b 中 
计算 的 概率 . 
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.102 石油 化 工厂 菜 的 含量 . 莱 是 常用 于 合成 塑料 


的 溶剂 , 在 诸如 脱 葵 漆 剂 和 高 辛 烷 无 铬 汽油 的 消 
Ra PRAE, 科学 家 把 苯 归 人 导致 白血病 的 试 
剂 类 里 . 令 了 表示 石油 化 工厂 空气 中 茶 的 含量 ( 百 
万 分 之 一 ), A YAREO, 1,2,3, =, 
1000000, 而 且 近 似 为 泊 松 概率 分 布 . 1978 4E, XX 
邦 政府 把 工作 地 点 空气 节 的 最 大 人 允许 含量 从 百 万 
分 之 十 (ppm) 降 低 到 百 万 分 之 一 , 违反 政府 标准 的 
任何 行业 将 受到 严重 的 惩罚 , 包括 昂贵 措施 的 执 
行 来 降低 茶 含 量 . 

a. 假设 石油 化 工厂 空气 中 芋 的 平均 含量 是 六 = 


离散 随机 变量 
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5 ppm, 求 石油 化 工厂 超过 政府 标准 1 ppm 的 

b. 假设 从 =2.5, 重复 a. 

c. 一 项 由 海湾 石油 公司 组 织 的 研究 表明 8806 [d HE] 
葵 的 工业 让 工人 接触 到 1 pmm 或 更 低 度 的 溶 
剂 , 假设 在 这 个 国家 你 随机 抽取 55 A PLEASE ME 
作为 样本 , 确定 违反 政府 标准 个 数 的 Y, 利用 泊 
松 对 二 项 的 近似 , 求 被 抽 到 的 工业 都 没有 违反 
政府 标准 的 概率 , 把 这 个 概率 与 利用 二 项 概率 
分 布 计算 的 精确 概率 作 比 较 . 

d. 参考 c, 利用 有 8896 使 用 茜 的 工业 让 工人 接触 
到 1 ppm 或 更 少 的 茜 的 事实 来 近似 , 这 些 行业 
空气 中 茶 的 平均 合 量 u (提示 : ERB. 4 中 寻 
找 使 P(Y<1) 最 接近 0. 88 BJ u f. ) 

103 ”航天 飞机 灾难 . 1986 年 1 月 28 H, 航天 飞机 

“挑战 者 ”爆炸 了 , 所 有 7 位 宇航 员 全 都 死 在 飞机 

E, 调查 结果 是 右 侧 火箭 推进 器 两 个 较 低 部 分 连接 

处 的 O 形 密封 垫圈 失效 导致 爆炸 . 美国 航空 航天 局 

(NASA ) 在 事故 发 生前 一 年 的 报告 中 , 宣布 这 种 失 

效 的 概率 大 约 是 1/60 000, 或 每 飞行 60 000 KKA 

有 一 次 失效 . 而 大 约 在 同一 时 间 , 空军 也 进行 了 风 

险 评 估 研 究 , 评估 的 概率 是 1/35, 或 每 35 次 任务 中 

大 约 有 1 K. 注 : 这 架 航 天 飞机 在 出 事 之 前 成 功 地 

完成 了 24 次 飞行 任务 . 已 知 1986 年 1 月 28 日 的 事 

fF, NASA 和 空军 的 风险 评估 哪个 看 起 来 更 合适 ? 

理论 练习 
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活动 中 的 统计 学 :“ 一 次 性 "装置 的 可 靠 性 


a. 求 了 的 均值 . 
b. 求 了 的 方差 . 
4.105 ” 设 Y 是 一 个 几何 随机 变量 , 证 明 : ECY) = 1⁄p. 
(提示 ; 写 出 
ECY) = po ya" 
y=1 

其 中 9 -21-p, 并 注意 到 

d wr 
因此 ， 

E(Y) = p> "Pi Y -«) 

然后 利用 事实 


ye - = 15 -q 
在 大 部 分 数学 手册 中 都 给 出 了 这 个 无 穷 级 数 的 
T. ) 
4.106 BEBEBEELAEER Y RERA PO 定义 为 : 
P(t) = E(t”) = p, + pt + pË + + 
其 中 p; 2 P(Y= i). 
a. 求 泊 松 分 布 的 P(t). ET: 写 出 


EG) = Y Qe e _ QUO > Qe ni 
yzÜ y=0 


EPA At ARAR. ) 
b. 利用 


ECY) AA 


和 E[Y(Y-1)]= TUS 
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产品 、 系 统 、 武 器 或 设备 零件 的 可 靠 性 定义 为 完成 规定 任务 的 能 力 , 简 而 言 之 , 是 使 用 时 设备 不 
失效 的 概率 ( 见 第 17 章 ). 工程 师 通过 重复 测试 并 观察 设备 的 失效 率 来 评价 可 靠 性 . 某 些 称 为 “一 次 
性 ”装置 的 产品 是 对 这 种 方法 的 一 个 挑战 . 因为 “一 次 性 ”装置 仅仅 能 使 用 一 次 , 使 用 后 要 么 毁 掉 ， 要 


么 重新 制造 . 
用 的 餐巾 、 热 源 探测 器 , 还 有 雷管 


“一 次 性 ”装置 的 一 些 例子 包括 : 核武 器 、 字 宙 飞 船 、 汽 车 的 气 职 、 燃油 喷 射 器 、 自 由 使 


一 次 性 装置 的 毁灭 性 质 使 反复 试验 要 人 么 不 现实 , 要 么 太 浪 费 钱 . 因此 必须 通过 最 少量 的 试验 来 
确定 这 种 装置 的 可 靠 性 . 为 了 证 实 可 靠 性 达到 预期 值 , 设计 师 必须 确定 对 装置 进行 的 最 少 测试 次 数 . 
例如 ,1983 年 本 田 公司 开始 评估 新 型 汽车 的 气囊 系统 , 公司 希望 达到 99. 999% 的 可 靠 性 . 为 了 掌握 


确定 “一 








次 性 ”装置 可 靠 性 的 最 好 技术 ,本田 公 司 的 设计 师 参 观 了 麦 唐 纳 -道格拉斯 航空 中 心 
测试 其 宇航 系统 的 . 
确定 “一 次 性 "装置 可 靠 性 当前 趋势 是 利用 抽样 验收 一 一 一 种 利用 二 


项 概率 分 布 确定 该 装置 是 


AX A — 


134 $435 





否 在 某 个 可 接受 的 风险 水 平 上 达到 可 接受 的 不 合格 率 的 统计 方法 . 这 个 方法 使 用 3. 9 节 描述 的 “稀有 
事件 ”方法 . 

可 以 将 基本 方法 概括 如 下 : 考虑 一 次 性 装置 失效 概率 为 p， 当然 p 的 真 值 是 未 知 的. 于 是 设计 工 
REUS p 规定 一 个 值 , 是 他 们 愿意 接受 的 最 大 不 合格 率 ( 这 个 p 值 通常 叫做 批 容许 不 合格 品 率 一 一 
LTPD). 工程 师 对 装置 进行 n 次 试验 , 确定 每 次 试验 是 成 功 还 是 失败 . 如 果 观 测 到 的 失败 次 数 小 于 或 
等 于 某 一 指定 的 值 , 则 工程 师 得 出 的 结论 是 : 装置 按 设计 执行 . 因此 工程 师 想 知道 要 求 的 样本 容量 
n 的 最 小 值 , 使 得 样本 中 观测 到 个 或 更 少 不 合 格 品 时 , 证 明 一 次 性 装置 失败 概率 的 真 值 不 超过 p. 

如 果 我 们 令 了 表示 样本 中 观测 到 的 失败 次 数 , 那么 根据 这 一 章 的 讨论 , 了 服从 参数 为 n 和 p 的 
二 项 分 布 . 利用 4. 6 节 的 二 项 公式 或 附录 B 的 二 项 表 , 可 以 求 出 观测 到 站 个 或 不 到 上 个 不 合格 品 的 概 
率 , B P(Y<E) 的 值 , 如 果 这 个 概率 小 (如 小 于 0.05)， 那么 或 者 是 观测 到 了 一 个 稀有 事件 , 或 者 更 
可 能 的 是 装置 的 真 值 p 小 于 指定 的 LTPD 值 . 

假定 一 次 性 装置 的 设计 失效 率 是 p =0.10, 还 假定 工程 师 进 行 了 n=20 次 装置 的 测试 WDR EI, 
即 如 果 在 样本 中 观测 到 1 次 失败 或 没有 失败 ,结论 是 装置 运行 达到 规定 ， 感 兴趣 的 概率 是 

P(Y<1) =P(Y=0) +P(Y=1) =p(0) +p(1) 

利用 表 B.2 的 p=0.10 和 n=20, 我 们 得 到 这 个 概率 为 0. 392. 由 于 这 个 概率 不 是 很 小 ( 即 不 是 稀 
有 事件 ) , 工程 师 不 可 能 断言 装置 的 失效 率 不 超过 总 体 的 0. 10. 

在 可 靠 性 研究 中 , 通常 称 1 - P( Y<%) 为 断言 真实 失效 率 小 于 或 等 于 p 的 “置信 水 平 ”. 在 上 面 的 
例子 中 , 1 - P(Y=1) =0. 608. 因此 , 工程 师 仅 仅 有 60. 8% 置信 一 次 性 装置 的 失效 率 不 超过 0. 10. 有 
几 种 方法 可 以 增加 置信 水 平 ， 一 种 方法 是 增加 样本 容量 ; 为 一 种 方法 是 减少 样本 中 允许 的 失效 次 
27 k. 

例如 , 假定 我 们 将 样本 中 允许 的 失效 次 数 由 =1 减少 到 大 =0, 那么 ， 样本 中 失效 的 次 数 不 超过 
k 的 概率 是 P(Y-0). 对 p =0.1 € n =20, 我 们 求 出 P(Y=0) =0. 122, 这 给 出 了 87. 896 的 置信 水 平 . 
你 可 以 看 出 置信 水 平 提高 了 , 然而 大 多 数 抽样 验收 的 工程 师 希 望 一 个 0. 90, 0.95 或 0.99 的 置信 水 
E. 这 些 值 相应 于 稀有 事件 的 概率 P(Y<k) 20.10, P(Y=k) =0.05, 或 者 P( Y<k) =0.01. 

现在 假设 我 们 把 样本 容量 从 n = 20 增加 到 n =30, 利用 4.6 节 的 二 项 公式 ,其 中 中 = 30, 
P=0. 10, 我 们 得 到 : 


P(Y<k) =P(Y=0) = (0)(0. 10)?(0.90)9 =0.042 和 1-P(Y<k) =1 -0.042 =0. 958 


现在 PCY&k) JT 0.05, 置信 水 平 超过 了 95%. 因此 如 果 在 样本 中 没有 观测 到 失效 ， 工程 师 将 
(以 95. 896 E) BERE; 一 次 性 装置 的 失效 率 超 不 过 p = 0. 10. 

你 能 看 到 用 试 凑 法 操纵 二 项 公式 中 p, nA kE, 你 能 确定 想 要 的 置信 水 平 . 美国 国防 部 可 靠 
性 分 析 中 心 (DODRAC ) 为 工程 师 提 供 了 自由 进入 的 表 和 工具 箱 ， 对 样本 中 观测 到 的 失效 次 数 ,为 达 
到 合乎 需要 的 置信 水 平 , 给 出 了 必须 的 最 小 样本 容量 . 对 于 评估 一 次 性 装置 的 可 靠 性 , 这 个 信息 是 
非常 宝贵 的 . 

表 SIM. 1 给 出 了 当 LTPD 设置 为 p =0. 10 时 , 抽样 验收 所 需要 的 样本 容量 表 . 表 中 显示 了 如 果 
设计 工程 处 师 希 望 以 99% 的 置信 水 平 , 允许 失败 次 数 大 =0 的 样本 , 他 们 需要 一 个 =45 次 试验 的 样 
本 大 小 . 类 似 地 , 如 果 设 计 师 希望 以 9%5% 的 置信 水 平 , 对 允许 失败 次 数 直 到 大 = 10 的 样本 , 他们 需要 
n=168 次 试验 的 样本 容量 . 
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X SIA4. 1 对 p=0.1 为 达到 需要 的 置信 水 平 必需 的 样本 容量 














置信 水 平 
失败 次 数 60% 80% 90% 95% 99% 
样本 容量 

0 9 16 22 29 45 
1 20 29 38 47 65 
2 31 42 52 63 83 
3 41 55 65 77 98 
4 52 67 78 92 113 
5 63 78 91 104 128 
6 73 90 104 116 142 
7 84 101 116 129 158 
8 95 112 128 143 170 
9 105 124 140 156 184 
10 115 135 152 168 197 
11 125 146 164 179 210 
12 135 157 176 191 223 
13 146 - 169 187 203 236 
14 156 178 198 217 250 
15 167 189 210 228 264 
16 177 200 223 239 : 278 
17 188 211 234 252 289 
18 198 223 245 264 301 
19 208 233 256 276 315 
20 218 244 267 288 327 
22 241 266 290 313 342 
24 262 286 312 340 378 
26 282 308 330 364 395 
28 303 331 354 385 430 
30 319 354 377 408 448 
35 374 403 430 462 505 
40 414 432 490 512 565 
45 478 510 550 580 620 
50 513 534 595 628 615 


资料 来 源 : Department of Defense Reliability Analysis Center, START; Analysis of “ One-Shot” Devices, Vol. 7, No. 4, 2000 (342). 


第 5 章 连续 随机 变量 


目标 区 分 连续 和 离散 随机 变量 以 及 它们 各 自 的 概率 分 布 ; 给 出 某 些 有 用 的 连续 概率 分 布 并 说 
明 如 何 利用 它们 解决 一 些 实际 问题 . l 


5.1 连续 随机 变量 


在 实际 生活 中 观测 到 的 许多 随机 变量 , 由 于 它 的 可 能 取 值 的 个 数 是 不 可 数 的 , 因此 不 是 离散 随 
机 变量 . 例如 , 交通 灯 的 等 候 时 间 Y( min) , 在 理论 上 它 的 可 能 取 值 是 0 < Y < oo 区 间 中 不 可 数 无 穷 多 
个 值 之 一 . Xn, 某 地 区 的 日 降雨 量 、 钢 条 强度 (lb/im? ) 以 及 一 天 中 某 一 特定 时 间 阳 光 的 强度 等 是 可 
能 取 值 为 实 直 线 上 一 个 或 多 个 区 间 中 不 可 数 无 穷 多 个 点 的 随机 变量 . 对 比 离散 随机 变量 , 这 类 变量 
称 作 连续 随机 变量 . 

上 面 的 讨论 指出 了 离散 和 连续 随机 变量 的 区 别 , 但 是 它 没有 指出 实际 问题 . 把 有 限 的 概率 指派 
给 一 个 直线 区 间 中 不 可 数 点 的 每 一 点 , 使 这 些 概 率 之 和 为 1, 这 是 不 可 能 的 . 因此 ,离散 随机 变量 和 
连续 随机 变量 的 区 别 一 般 是 基于 它们 的 累积 分 布 函数 的 不 同 . 

定义 5.1 随机 变量 了 的 累积 分 布 函数 FC.) 等 于 概率 

F(yo) -P(Yxyg), =œ <yo<% 

对 于 离散 随机 变量 , 它 的 累积 分 布 函数 是 P(y) 从 了 所 取 的 最 小 值 到 yo 的 累积 和 . 例如 ,由 表 

B. 2 中 的 累积 和 , 对 二 项 随机 变量 , n 25, p =0.5, 我 们 得 到 下 列 F(y) fü: 


F(0) = P(Y < 0) = 2 = p(0) = 0.031 em 
1 0.3 - 
F(1) = P(Y x1) = Yp(y) = 0.188 


F(2) = P(Y x2) = Y yi») - 0. 500 


F(3) - P(Yx3) z0.812 0.1 F 

F(4) = P(Yx4) =0. 969 

F(5) 2P(Yx5) =1 O J. 3453 "° 

SS LIU Ty E Pln MESTA ENG 到 "eee 
. 个 概率 长 方形 面积 之 和 . 概率 值 F(3) 是 图 中 的 阴 ESAT. BIER CS n5 

对 n=5, p=0.5 的 二 项 随机 变量 的 累积 分 布 函数 图 见 图 5.2, 这 个 图 给 出 了 所 有 离散 随 人 机变 
量 累积 分 布 函数 的 一 个 重要 性 质 : 它们 是 阶梯 函数 . 例如 ， 随 着 了 的 增加 ， 直到 Y=1,F(y) 等 于 
0.031, 然后 FCy) 突然 跳跃 到 F(1) 20.188. 随 着 了 的 增加 直到 了 =2，F(y) 的 值 保持 不 变 . 然后 
F(y) 突然 升 到 F(2) =0. 500. 因此 , F) 是 一 个 不 连续 函数 , 在 可 数 个 点 (Y=0,1,2,3 和 4) 处 
向 上 跳跃 . 

对 比 离散 随机 变量 的 累积 分 布 函数 , 连续 随机 变量 的 累积 分 布 函数 是 一 一 个 关于 y 的 单调 递增 连 
RRR. 这 说 明 F(y) 是 一 个 连续 函数 , WEE ya < Yr, WA FO) SFO), BEŽ y 的 增加 , FO) 





过 续 随 机 变量 137 





是 不 减 的 . 连续 随机 变量 的 累积 分 布 函 数 图 可 以 如 图 5.3 所 示 . 





F(y) 
1.0 e—— 
0.969 — 
0.812 — 
FO) 
0.500 — 10 
0.188 — 0.5 
0.031 fi | A. d =y 
0 1 2 3 4 5 y 


图 5.2 二 项 随机 变量 (n=5, p=0.5) 的 累积 分 布 函数 F(y) 图 5.3 连续 随机 变量 的 累积 分 布 函数 


定义 5.2 ”连续 随机 变量 了 具有 以 下 三 条 性 质 ; 

1. 在 区 间 ( - o, ç ) 上 的 随机 变量 了 取 不 可 数 无 穷 多 个 值 . 
2. 累积 分 布 函数 F(7) 是 连续 的 . 

3. 了 等 于 任 一 特定 值 的 概率 为 0. 


5.2 连续 随机 变量 的 密度 函数 


在 第 1 章 , 我 们 用 相对 频率 分 布 描述 一 个 大 的 数据 集合 . 若 数 据 表示 一 个 连续 随机 变量 的 测量 
fH, 且 数 据 量 非常 大 , 则 我 们 可 以 缩小 组 距 的 宽度 ， 直到 这 个 分 布 呈 现 为 一 条 光滑 的 曲线 . 概率 密度 
函数 是 这 个 分 布 的 理论 模型 . 

定义 5.3 车 F(y) 是 连续 型 随机 变量 了 的 累积 分 布 函 数 ， 则 Y E REIR (Cy) 


-aF(y) fo) 
f(y) d; y 
连续 随机 变量 了 的 密度 函数 ， 作为 数据 的 某 个 真实 总 
体 模型 ,通常 是 一 条 光滑 的 曲线 ， 如 图 5.4 所 示 . 由 定义 ING 
5.3 可 得 : ú 
FO) = P ioa 图 5.4 ”连续 随机 变量 的 密度 函数 f(y) 


因此 , 在 曲线 下 由 oo 到 yo 点 的 累积 面积 等 于 F(yo). 
连续 随机 变量 的 密度 函数 一 定 满足 下 面 给 出 的 三 条 性 质 . 





连续 随机 变量 了 的 密度 函数 的 性 质 
1. f(y) >0. 


2. Any = Fæ) = 1. 








3. P(a < Y < b) = (7G0dy = FO) - F(a), RP ab AYA. 
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LEME 设 - 是 一 个 常数 , 考虑 连续 随机 变量 了 的 下 列 密度 函数 : 


若 0<y<1 
f= xa 
a. 求 c 值 . 
b. 求 P(0.2 <Y<0.5). 
解 


a 因为 f(y)dy 等 于 1, 我 们 有 


[rone = f etr s ex I : (1)- i 


解 得 =2, 因此 , f(y) =2y， f(y) 的 图 如 图 5.5 所 示 . 
0.5 .£0.5 0.5 
b P(0.2 < Y <0.5) = | fo) = | 2yay = 2 
0.2 0.2 0.2 
这 个 概率 值 , 如 图 5. 5 中 阴影 部 分 所 示 , 就 是 在 密度 函数 下 Y=0.2 到 了 =0.5 之 间 的 面积 
参考 例 5. 1. 求 随机 变量 了 的 累积 分 布 函 数 , 然后 求 (0.2) 和 (0.7). 
解 ” 由 定义 5.3, 可 得 








= (0.5)? - (0.2)2 = 0.25 -0.04 = 0.21 





2 
FO) = fiac» fna = 2 (£) |” = 2 
则 

F(0.2) =P(Y<0.2) =(0.2)2 =0. 04 

F(0.7) =P(Y<0.7) = (0.7)2 =0.49 
当 了 =0.7 时 F(y) 的 值 ( 即 F(0.7) ) 为 图 5.6 中 的 阴影 面积 . 
fly) 

iu | 
1} 
F(0.7) 
y L [ ao 

















0 02 05 D. 0 05 0.7 1 
图 5.5 485.1 的 密度 函数 /(y) 图 形 图 5.6 例 5.2 的 密度 函数 /(y) 图 形 ; 阴影 面积 是 F(0. 7) 


在 统计 中 应 用 的 许多 连续 随机 变量 ， 对 它们 的 密度 函数 积分 不 能 用 显 式 表达 ,只 能 用 数值 方法 
JUR. 附录 B 给 出 了 某 些 这 种 密度 函数 下 的 面积 表 , 需要 时 会 给 以 介绍 . 


理论 练习 b， 求 累积 分 布 函数 F(y). 
5.1 设 c 是 一 个 常数 , 考虑 随机 变量 了 的 密度 函数 ， i s 
Ky) = 位 1. e 计算 P(1&Y«1 5). 


9.2 设 c 是 一 个 常数 , 考虑 随机 变量 了 的 密度 函数 ， 
a. 求 c 值 . 
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c(2-y) #0=y=1l b. 求 累积 分 布 函数 FC y). 
fo) = Ë 其 他 c. 计算 F( -0.5). 
a 3Ë c ff. d. 计算 P(0zY«O. 5). 
b, 求 累积 分 布 函 数 F(y). 选 做 的 理论 练习 
° Mi UM 06 5.6 ”连续 概率 分 布 为 元 件 (如 计算 机 芯片 、 灯泡、 汽 
. 1 .1<Ys 0.6). 车 、 空调 机 等 ) 的 寿命 期 限 提供 了 理论 模型 . 通常 ， 
$3 设 。 是 一 个 常数 ,考虑 随机 变量 Y 的 密度 函数 。 知道 用 新 元 件 定期 更 换 旧 元 件 是 否 很 好 是 很 重要 
most. $0 的 . 例如 , 对 于 某 种 型 号 的 灯泡 , 使 用 一 段 时 间 的 
其 他 旧 灯泡 可 能 比 新 灯泡 有 更 长 的 寿命 . 设 了 表示 某 种 
a. OK c fi 元 件 的 寿命 ,累积 分 布 函 数 为 FO). 若 对 所 有 的 
b. 求 累 积分 布 函 数 F(y). x,y>0, 
c. 计算 F(2.6). _ _ _ 
d. 证 明 F(0) =0 RLF( ) =1. Pur) EPO) FY 
e. 计算 P(1<Y<5). 其 中 F(y) 21- FG), MAN e" 248 ER 
5.4 设 c 是 一 个 常数 , 考虑 随机 变量 了 的 密度 函数 : 《y) 新 的 比 旧 的 好 (NBU) ( Microelectronics and Relia- 
(17)e7? 车 y=0 bility, 1986 年 1 H). 或 者 若 对 所 有 的 x,y>0, 
fo) -| _ TM 
ac (17c)e 石 Y<0 F(x+y)>F(x)F(y) 
b. PR81254 838 FO). 则 “寿命 ”分布 F(y) 新 的 不 如 旧 的 好 (NWU). 
c. 计算 FCD. a， 考 虑 密度 函数 
d. 计算 P(Y>0.5). y2 车 0<y<2 
5.5 设 c 是 一 个 常数 , 考虑 随机 变量 了 的 密度 函数 ， fo) -D 其 他 


a. 


c+y #-l<y<0 


fo) d 若 0 去 y<1 


R c Ë. 


5.3 连续 随机 变量 的 期 望 值 
回忆 学 过 的 微 积分 ， 积 分 是 一 个 求 和 的 过 程 . 因此 , 求 连续 随机 变量 的 积分 
FOy) = |” ADd 


类 似 于 对 离散 随机 变量 求 和 : 


求 "寿命 ”分布 FCy). 
b. 判定 寿命 分 布 F(y) 是 NBU 还 是 NWU. 


F(yo) = Y p(y) 


因此 很 自然 的 , 对 连续 随机 变量 了 的 期 望 值 , 一 个 函数 z(y) 的 期 望 值 以 及 了 的 方差 , 给 出 与 4. 3 节 
中 离散 随机 变量 相同 的 定义 , 唯一 的 区 别 是 积分 符号 代替 求 和 符号 . 同样 可 以 证 明 ( 证 明 略 )4.4 节 
的 期 望 定理 对 连续 随机 变量 也 成 立 . 现在 我 们 概述 这 些 定义 和 定理 ， 并 给 出 一 些 应 用 的 例子 . 


的 期 望 值 为 : 


定义 5.4 设 了 是 一 个 连续 随机 变量 ,密度 函数 为 f(y)， gC(Y) & Y 6948 € dk, N Y do g(Y) 


E(Y) = [. xfCy) dy 


E[g()] = f aGOfGDdy 
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定理 5.1 设 c 是 一 个 常数 , 了 是 连续 随机 变量 , Egi(Y),g; (Y), g, (Y) R Y kA, 

则 
五 (c) =c 
E(cY) = cE( Y) 
Elgi (Y) +g (Y) + +g ,(Y)] - EL (Y) ] +E[g,(Y)] ++ +E[zg,(Y)] 
定理 5.2 设 了 是 一 个 连续 随机 变量 ， 且 天 (了 ) =u, MJ 
a? -E[(Y-4)?] = E(12) -,2 

UERS 参考 例 5. 1, 求 连 续 随 机 变量 了 的 期 望 值 和 标准 差 . 

解 [BB f(y) 22y. 因此 ， 





o 1 1 3 |i 2 
E(Y) - [fona - [xà - [| 2245 = s: CRT 

oo 1 1 4|1 
E(Y) = | food = [| Qna = f 22ay = ax ps Y 





则 由 定理 5.2 得 ， 


有 
o= v0.0556 20.24 
参考 例 5. 1 和 5.3. KH p +20 如 图 5.7 中 f(y) 图 形 所 示 , R Plu -2 «Y «p *20). 
i di S. 3, Æ = 2 -=0.67 flo =0. 24. 因此 ,pj -20 20.19 fO) 


Hu+ 20=1.15. HF P(Y>1) =0, 因此 我 们 希望 求 概率 P(0.19< 2- 
Y<1), 这 相应 于 图 5.7 中 的 阴影 面积 : 


1 














P(u -20 < Y <p+20)= P(0.19 «Y «1) = ,ADdy i 
1 
PR 
~ Je. 927dy =y 0.19 0 0.19 05 f 1115? 
-1-(0.19)? = 0.96 [ei — 25 —] 
在 第 1 章 中 , 我 们 把 经 验 法 则 应 用 到 数据 的 丘 形 相对 频率 分 布 ， u= 3 


经 验 法 则 也 可 应 用 到 理论 上 是 丘 形 的 ( 即 概率 ) 分 布 . 如 前 几 章 给 出 
的 例子 ,一 个 数据 集合 落 在 区 间 人 +2cx 的 百分数 (或 比例 ) 通 常 非常 
接近 于 由 经 验 法 则 指定 的 值 0. 95. 对 于 例 5.4 中 考虑 的 概率 分 布 这 
也 是 完全 正确 的 . 

设 了 是 一 个 连续 随机 变量 , 概率 密度 函数 为 : 


- y/2 


图 5.7 向 中 给 出 了 对 f(y) =2y 
HKI] u +20 


> 
fo» -| 2 
0 其 他 
求 了 的 期 望 值 、 方 差 和 标准 差 . (这 个 密度 函数 称 作 指数 概率 分 布 . ) 
解 ”随机 变量 了 Y 的 期望 值 由 下 式 给 出 : 


若 0<y< om 


连续 随机 变量 
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u = E(Y) = EOL = f. ye dy 
为 计算 这 个 定 积分 , 我 们 利用 在 许多 数学 手册 中 都 能 找到 的 常用 公式 9， 
[rea - em -1) 
iBa- RA, 
u= y (4) =2 
ADR o? , 我 们 先 应 用 一 般 公式 
ea = Lom png, 


REY), SRB a = - 广 和 m=2, 有 


oo æ .24-)/2 
EQ?) = | PIa = f^ 7577 = (6) = 8 





因此 , 由 定理 5.2， 
o? -E(Y)) -w =8 - (2)? «4 
和 
o =44 =2 
Fl 5. 8 给 出 了 例 5.5 的 密度 函数 图 形 . R P(u -2o0 « Y «a +20). 
解 例 5.5 求 得 了 j=2 以 及 oa =2, 因此 fo) 
-20 =2 -4 = -2 D| u +20 26. HH y «0 Bf dil 
f(y) =0， 
P(u -20 «Y «y *2o) 
- MOL = 55 = e> | 


= 1 — e = 1 — 0.049787 = 0.950213 | 
第 2 章 的 经 验 法 则 给 出 了 这 个 概率 的 一 02 

个 好 的 近似 是 0.95. 你 可 以 看 到 对 于 指数 密 

度 陶 数 ， 近似值 非常 接近 于 精确 概 




















率 0.950213. L 
在 许多 实际 问题 中 , 我 们 想 知 道 随 机 变量 


| —L. 
1 2 3 4 5 


了 的 方差 (或 标准 差 ) , d BR ce Y db cV 的 标 ESE 例 5.5 的 密度 函数 图 





O PAn, B Standard Mathematical Tables(1969). 另外 ,此 结果 可 由 分 部 积分 导出 ， 
fre ?dy = a f " dy 


这 个 结果 也 可 由 分 部 积分 导出 . 





6 
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E35, 其 中 是 一 个 常数 . 例如 , 我 们 可 能 知道 某 种 类 型 的 计算 机 芯片 重量 Y Ci nd ) 的 标准 差 , 并 





希望 求 得 用 克 表 示 的 重量 的 标准 差 . 因为 1 ÆR] =28. 349527 g, 所 以 我 们 要 求 cy 的 标准 差 .其 中 
c =28. 349527. 定理 5.3 给 出 了 c+ 了 及 c 了 的 方差 . 
定理 5.3 设 了 是 一 个 随机 变量 日 , 均值 为 及 , 方差 为 go?2. 则 c+ 了 以 及 c 了 的 方差 为 : 


J^ V(cY) 2092, 2 2o? 
定理 5.3 的 证 明 由 定理 5. 1 知道 E(cY) -cECY) = qx, 由 随机 变量 方差 的 定义 , 有 
V(cY) 2ozy EL (eY -q?] =E|[e(Y-n)]2] 2 E[2 (Y -4)?] 


V(c Y) =e D = 


由 定理 $. 1 ， 
a2, à E[ (Y-4)?] 
[BÆ E[ (Y-4)?1 2 0?. 因此 


o2, = 2 o2 


作为 定理 5. 3 应 用 的 例子 , 假定 计算 机 芯片 重量 了 的 方差 为 1. 1028 80)2.. 则 用 克 表 示 的 重量 的 
方差 等 于 (28. 349527)? (1.1) = 884. 1(g)*, 用 克 表 示 的 重量 的 标准 差 等 于 V884. 1 =29.7 g 


(9) 应 用 练习 

5.7 火车 的 晚点 时 间 . 经 常 来 往 于 某 两 地 间 的 火车 
晚点 的 时 间 Y( min) 是 一 个 连续 随机 变量 ,概率 密 。 
度 为 : 


5(25 -y,) 车 -5 «y«5 


0 其 他 
注 : 了 的 负 值 表示 火车 早 到 了 . 

a. 求 以 分 钟表 示 的 火车 晚点 时 间 的 均值 和 方差 . 
b. 求 以 小 时 表示 的 火车 晚点 时 间 的 均值 和 方差 . 
c. 求 以 秒表 示 的 火车 晚点 时 间 的 均值 和 方差 . 

5.8 影印 机 的 摩擦 力 . 罗 彻 斯 特大 学 的 研究 员 研 究 影 
印 机 在 送 纸 过 程 中 发 生 的 摩擦 (Journal of Engineering 
for Industriy, 1993 年 5 月 ). 摩擦 系数 是 度量 在 送 纸 机 
架 上 两 张 相 邻 纸 之 间 摩 擦 程度 的 比例 . 在 一 次 试验 
中 , 用 三 角形 分 布 对 摩擦 系数 了 建 模 ( 见 下 图 . ) 


fo) -| 


三 角形 摩 控 分 布 的 密度 函数 为 ; 
pet Eu-c«y«pu 
IODE DY 车 pcy<ate 
0 其 他 





O ”这 个 定理 适用 于 离散 随机 变量 或 连续 随机 变量 


其 中 c >0. 
fb) 三 角形 





utc 


下 一 C m 


a 证 明 [ f(y)dy = 1. 


b. 求 三 角形 摩擦 分 布 的 均值 . 
c. 求 三 角形 摩擦 分 布 的 方差 . 


理论 练习 


5.9 求 下 列 每 一 个 练习 中 的 j 和 ox. 然后 计算 P(u - 
2o «Y «n +20), 并 与 经 验 法 则 比较 . 

练习 5. 1. 

.练习 5.2. 

. 练习 5.3. 

练习 5. 4. 

. e 练习 5. 5. 

5.10 证 明定 理 5. 1. 

5.11 证 明定 理 5. 2. 


£ ° m= pP 
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5.4 均匀 概率 分 布 


假设 随机 选取 一 个 用 区 间 a<Y<b 上 的 点 表示 的 数 Y. 那么 了 的 密度 函数 用 图 表示 为 一 个 长 方形 ， | 
如 图 5.9 所 示 . 注意 到 长 方形 的 高 是 1/(4 - a) ,以 保证 长 方形 的 面 fo) 
积 等 于 1 S 

图 5. 9 中 所 示 类 型 的 随机 变量 称 作 均匀 随机 变量 ; “Z BU iz BS S y 


给 出 . ° i 











均匀 概率 分 布 
均匀 随机 变量 了 的 概率 密度 函数 为 : 
A yb 
0 其 他 
p=% o = 











815.7 | 假设 茶 钢铁 厂 的 研发 部 门 认为 公司 的 一 台 辊 压 机 正在 生产 厚度 不 同 的 钢板 . 厚度 了 是 -个 
均匀 随机 变量 , 取 值 在 150 ~ 200 mm 之 间 . 任何 厚度 小 于 160 mm 的 钢板 都 必须 报废 , 因为 它 不 符合 
买 家 的 要 求 . 
a 计算 这 台 机 器 生产 的 钢板 厚度 了 的 均值 和 标准 差 . 然后 画 出 这 个 概率 分 布 , 在 水 平 轴 标 出 均 
值 . 并 且 标 出 均值 周围 1 个 和 2 个 标准 差 区 间 . 
b. 计算 这 人 台 机 器 生产 的 必须 报废 的 钢板 比例 
s 
a 为 了 计算 Y 的 均值 和 标准 差 ,我们 分 别 用 150 和 200 mm 代替 公式 中 的 a 和 及 因此 ， 
a+b 150 +200 





B= 7 = > =175mm 
以 及 
_b-a 200-150 50 _ 
= UT AS =s 464 = 14. 43 mm 
均匀 概率 分 布 为 ， 
1 
f(y) = l l 





b-a 200-150 50 

图 5. 10 给 出 了 这 个 函数 的 图 形 , 水 平 轴 上 标 出 了 均值 以 及 均值 附近 1 个 和 2 个 标准 差 区 间 . 

b. 为 了 求 这 台 机 器 生产 的 应 报废 的 钢板 比例 ， 我 们 必须 求 厚度 了 小 于 160 mm 的 概率 . 如 图 
5.11 所 示 , 我 们 需要 计算 在 频率 函数 f(y) 下 , 点 4 = 150 与 c=160 之 间 的 面积 , 它 就 是 底 为 160 - 


150 -10, 高 为 50 的 长 方形 面积 所 以 必须 报废 的 比例 是 : 


P(Y<160) =( 底 )( 高 ) =(10) (35) = 
也 就 是 这 台 机 器 生产 的 20% 的 钢 片 必须 报废 


1 
5 








凡 一 20 


u~- m 


E 5.10 例 $.7 中 了 的 频率 函数 








fo) 
o ; | | _ 
0 74 150 160 170 180 190 200 , 
Bd 5.11 钢板 厚度 了 在 150 ~ 160 之 间 的 概率 


RB. 1 中 的 随机 数 是 由 随机 选取 来 自 均 匀 分 布 y 值 的 计算 机 程序 产生 的 . (但 随机 数 在 某 指 定 的 





小 数位 终止. ) 第 7 章 将 描述 均匀 分 布 的 一 个 最 重要 的 应 用 , 与 生成 随机 数 的 计算 机 程序 起 我 们 可 


以 用 它 来 模拟 对 许多 其 他 类 型 随机 变量 的 抽样 . 


应 用 练习 
5.12 保持 管 壁 的 温度 . 在 某 些 热 工 艺 应 用 中 , 保持 
管 壁 恒温 是 很 重要 的 . Journal of Heat Transfer ( 2000 
^E 11 月) 提出 了 一 项 利用 涂 微量 元 素 保持 温度 的 
新 技术 . 没有 涂 微量 元 素 时 ,用 于 生产 塑料 的 切换 
冷凝 器 管 壁 温度 服从 260 ~290 下 的 均 色 分 布 . JL 
种 微量 元 素 贴 附 在 管道 上 时 ， 管 壁 温度 服从 
278 -285'F 上 的 均匀 分 布 . 
a. 理想 的 管 壁 温度 应 当 在 280 ~ 284 下 范围 内 . 当 
没有 涂 微 量 元 素 时 ,温度 落 在 这 个 理想 范围 内 
的 概率 是 多 少 ? 当 微 量 元 素 涂 在 管道 上 时 ,这 
个 概率 又 是 多 少 ? 
b， 当 温度 是 268 下 或 更 低 时 , 热 的 液态 塑料 变 硬 
(REHE), 引起 在 管道 上 积聚 . 当 没 有 涂 微量 
元 素 时 , 塑料 固定 的 概率 是 多 少 ? 当 微 量 元 素 
贴 附 在 管道 上 时 , 这 个 概率 又 是 多 少 ? 
. 13 系统 的 周期 有 效 性 . 在 系统 维护 术语 中 ,“ 周 
期 有 效 性 ”定义 为 系统 在 任意 时 间 点 运转 的 概率 . 
美国 国防 部 开发 了 一 系列 评估 系统 周期 有 效 性 的 
工作 指标 (START，Vol. 11, 2004). 在 关于 系统 失 
效 时 间 和 维护 时 间 的 某 种 假定 下 , 证 明了 周期 有 
效 性 是 0 ~1 之 间 的 均匀 分 布 . 求 周 期 有 效 性 的 下 
列 参数 : 均值 、 标 准 差 、 第 10 百 分 位 数 、 下 四 分 位 
数 和 上 四 分 位 数 . 解释 这 些 结果 . 
14 电路 轨 线 . 加 利 福 尼 亚 -伯克利 大 学 的 研究 人 
员 设 计 、 制造 并 检验 一 种 用 于 产生 随机 信号 的 开 
关 电 容器 电路 . ( Internationnal Journal of Circuit 
Theory and Applications, 1990 Æ 5 -6 H ) ra 路 轨 线 
证 明 是 服从 区 间 (0, 1) 上 的 均匀 分 布 . 
a 给 出 电路 轨 线 的 均值 和 方差. 


a 


e 


em 


b. 计算 轨 线 落 在 0.2 ~0.4 之 间 的 概率 . 

c 你 期 望 观测 到 一 个 超过 0.995 的 轨 线 吗 ? 说 明 
理由 . 

5.15 压力 清洗 器 的 清洗 率 . 某 制造 公司 研发 了 一 

种 把 压力 清洗 与 燕 汽 清 洗 相 结合 的 节能 机 器 . 对 于 

压力 清洗 , 设计 以 1000 1b/in2 的 压力 , 每 分 钟 提供 

7 加 仓 除 拍 剂 . KRE, 每 分 钟 提供 量 是 任 一 个 6.5 

和 7.5 加 仑 之 间 的 了 随机 变量 . 假定 提供 的 除 垢 剂 

量 是 均匀 随机 变量 , 概率 密度 为 

_ [1 #6.5=y=7.5 

f(y) = lo 其 他 

a. 求 了 的 均值 和 标准 差 , 然后 画 f(y) 图 , 标 出 均 
值 位 置 ， 以 及 均值 周围 的 1 个 和 2 个 标准 差 
区 间 . 

b. 求 每 分 钟 分 配 超 过 7.2 加 仑 除 垢 剂 的 概率 . 

16 道路 投标 合同 . 交通 部 (DOT) 已 经 确定 道路 建 

设 合同 ( 低 价 ) 中 标价 Y( 美 元 ) 是 均匀 分 布 , 概率 

密度 函数 为 

总 BA eyed 

o ”其 他 

其 中 ad 是 这 项 工作 成 本 的 DOT 估计 值 . 

a. 求 了 的 均值 和 标准 差 . 然后 画 出 Ly) 图, 标 出 均 
值 位 置 ,以 及 均值 周围 的 1 个 和 2 个 标准 差 
区 间 . 

b， 道 路 建设 合同 中 标价 低 于 DOT 佑 计 值 的 比例 是 
多 少 ? 


Ky) -| 


. 17 d ES SU. 模具 机 车 间 生 产 一 种 具有 极 高 容 


错 的 轴 , 这 个 轴 是 一 个 用 于 各 种 军事 设备 的 18 in 
长 的 细 杆 . 用 于 生产 这 种 轴 的 一 种 设备 偶尔 会 发 生 
故障 , 使 得 在 轴 的 某 个 位 置 留 下 一 个 羡 孔 . 然而 ， 
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如 果 轴 可 以 割 成 没有 羡 孔 连续 的 14 im K, 那么 这 来 自 均匀 分 布 随机 数 的 能 力 . 例如 ，SAS 函数 RA- 
个 轴 可 以 挽救 作为 其 他 使 用 . 假定 轴 上 淄 孔 位 置 能 NUNI 用 模 为 2”-- 1, 乘 子 为 397 204 094 的 素数 模 
用 均匀 分 布 很 好 的 描述 , 那么 有 缺陷 的 轴 可 以 挽 乘法 发 生 器 , 产生 来 自 区 间 (0, 1) 上 均匀 分 布 的 随 
救 利用 的 概率 是 多 少 ? 机 变量 Y. 利用 恰当 的 变换 ,这 个 函数 可 产生 任意 
18 机 器 人 装置 的 可 靠 性 . 一 部 设备 的 可 靠 性 通常 区 间 (a, 6) 上 的 均匀 随机 变量 , 其 中 a 和 5 是 
定义 为 在 规定 条 件 下 , 给 定 的 一 段 时 间 内 设备 成 常数 . 


o 





功 地 完成 规定 任务 的 概率 P. ( Render and. Heizer , a. 证 明 : 随机 变量 W - bY 是 区 间 (0, 0) 上 的 均匀 
Principles of Operations Management, 1995. ) 由 于 P 分 布 . 
是 随时 变化 的 ,一些 可 靠 性 分 析 人 员 把 P 作为 一 b. 求 了 的 一 个 函数 ,使 得 在 区 间 (c，0) 上 均匀 
个 随机 变量 处 理 . 假设 一 个 分 析 人 员 用 下 面 的 分 布 分 布 . 
刻画 自动 装配 线 上 某 个 机 器 人 可 靠 性 的 不 确定 性 :5.20 假定 随机 变量 了 是 区 间 as Y<b 上 的 均匀 分 
1 Ozpxl 布 . 验证 : 
AP lo 其他 tb be 
a， 男 出 分 析 人 员 关 于 P 的 概率 分 布 . 2 12 
b. 求 P 的 均值 和 方差 Y-9 若 a<y<b 


c. 根据 分 析 人 员 的 的 概率 分 布 , P 大 于 0.95 的 b. F(y) = 
概率 是 多 少 ? 小 于 0.95? 


> E3 +K = 1 i y>b. 
d. 假设 分 析 人 员 获得 另外 的 信息 , 已 一 定 在 0.90 
和 0.95 之 问 ,但 是 它 位 于 这 些 介 的 什么 位 置 是 5.21 证 明 : 在 区 间 (0,1) 上 均匀 分 布 是 新 的 比 旧 的 


完 定 ; B ; 好 (NBU). (NBU 的 定义 见 选 做 的 练习 5. 6. ) 
全 不 的 . 描述 分 析 人 员 现 在 用 于 描述 P 
MEAM. BER ' i .22 假定 了 Y 是 区 间 0<Y<1 上 的 均匀 分 布 . 证 


、 8j:XPPam0O,bm0H(acb) <1, 
(3) 理论 练习 P(a<Y<a+b) =b 
5.19 统计 软件 包 , 如 SAS 和 MINITAB, 具有 产生 


5.5 正 态 概率 分 布 


正 态 (或 高 斯 ) 密度 函数 是 由 C.F. Gauss(1777 一 1855 ) 提出 的 , 作为 误差 (如 测量 误差 ) 的 
相对 频率 模型 . 令 人 惊奇 的 是 ,这 种 钟 形 曲线 为 从 许多 不 同 科学 领域 收集 的 数据 的 相对 频率 分 
布 提供 了 一 个 合适 的 模型 ,正如 第 7 章 将 要 介绍 的 , 它 也 是 用 于 推断 许多 统计 量 概 率 分 布 的 
模型 . 

正 态 随机 变量 具有 一 个 由 两 参数 刻画 的 密度 函数 . 这 个 密度 函数 及 其 均值 和 方差 见 下 面 的 框 格 . 


a 





正 态 概率 分 布 
正 态 随机 变量 了 的 密度 函数 为 : 


fo) s uU -a eye m 
Gg T 





参数 几 和 分 别 为 正 态 随机 变量 了 的 均值 和 方差， 
存在 无 穷 多 个 正 态 密度 函数 一 一 对 应 每 一 个 凡 和 er 的 组 合 . 均值 凡 度 量 分 布 的 位 置 , 标 准 差 0 EE 
布 的 分 散 程度 , 图 5. 12 给 出 了 几 种 不 同 的 正 态 密度 函数 . 














正太 密度 函数 的 积分 没有 显 式 表 示 ,， 然而 可 以 用 近似 方法 和 定理 5.4 得 到 正 态 曲线 下 的 
面积 . 
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图 5. 12” 几 个 具有 不 同 均值 和 标准 差 的 正 态 分 布 


定理 5.4 RYRM m TAA P 的 正 态 随机 变量 ， 则 Z = 了 -从 是 一 个 均值 为 0， > 


Ž %1 的 正 态 随 机 变量 9. 随机 变量 Z 称 作 标 准 正 态 变量 . 
天 B. 5 给 出 了 标准 正 态 变量 
z=Y L 
G 


的 面积 . 回顾 2. 6 节 , Z 表示 正 态 随 机 变量 Y 和 它 的 均值 ,之 间 以 标准 差 o 为 单位 的 距离 
表 B.5 给 出 的 是 正 态 曲线 下 , 均值 Z=0 与 U 
均值 右边 某 个 Z 值 之 间 的 面积 ( 见 图 5.13). 为 了 d 
求 正 态 曲 线 下 Z=0 与 辟 如 Z=1.33 之 间 的 面积 ， 
向 下 移动 表 5 的 左 栏 到 2 =1.3 行 上 , 然后 移动 表 
的 上 栏 到 标 有 0. 03 的 列 ， 行 与 列 交叉 的 位 置 给 出 
了 面积 4 =0.4082. 由 于 正 态 曲 线 关于 均值 是 
对 称 的 ,均值 左边 的 面积 等 于 相应 的 均值 右边 的 





A =0.4082 ( 阴影 区 域 ) 








面积 . 例如 , 均值 Z=0 和 2= -0.68 之 间 的 面积 Se Vs sb C "ROw 13 
4 等 于 Z=0 和 2Z=0.68 之 间 的 面积 . 3E 5 中 对 应 133 L33 
0.6 fT fü 0.08 列 交叉 处 的 值 即 为 这 个 面积 图 5.13 说 明 表 B.5 给 出 的 表 列 值 
A 20. 2517. 的 标准 正 态 密度 函数 


假设 Y 是 一 个 均值 为 10、 标 准 差 为 2.1 的 正 态 分 布 随机 变量 . 
a. 求 P(Y=11). I 
b. 求 P(7.6<Y<12.2). 
i 
a. Y=11 对 应 的 Z 值 为 : 


z=Y-g 11-10 jg 
e= 2.1 


因此 , P(Y<11) = P(Zz0.48). 在 标准 正 态 曲线 下 ， 相应 于 这 个 概率 值 的 面积 即 为 图 5. 14 中 的 阴 








O 2 的 均值 和 方差 分 别 为 0 和 1 的 证 明 留 作 理论 练习 . 
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影 部 分 . 因为 正 态 曲 线 关 于 了 = 0 是 对 称 的 , 曲线 下 总 的 面积 为 1, Z =0 右边 的 面积 等 于 0.5， 因 此 
阴影 部 分 的 面积 等 于 (0.5 -4), 其 中 4 为 对 应 于 Z = 0.48 表 列 的 面积 . 由 表 B.5 给 出 面积 4 为 
0. 1844. 因此 
P(Yz11) =0.5 -4=0.5-0.1844 =0. 3156 
b. `i Y, =7.6 I Y, 212.2 BF, 对 应 的 Z 值 为 : 


= 2.1 
_ Y; -pn 12,2510 
Cr 2.1 
概率 P(7.6<Y=<12.2) =P( -1.14<Zs1.05) 是 图 5.15 中 的 阴影 面积 . 它 等 于 分 别 相应 于 2 5 Z, 
的 面积 41 与 A, 的 和 , 其 中 A, =0.3729, A, 20.3531. 因此 ， 
P(7.6&Y<12.2) =A, +A, =0. 3729 +0. 3531 =0. 7260 





Z, =1.05 

















f(z) f(z) 
A A 
f | 4 
S3 x4 0 | I 2 Met " ms | 0 2 à < 
z =0.48 zj = —1.14 25 == 1.05 
图 5.14 例 5.8 中 的 标准 正 态 分 布 ; 图 5.15 455.8 中 的 标准 正 态 分 布 
阴影 面积 是 P(Yz 11) 


美国 农业 部 (USDA ) 申请 了 利用 细菌 去 除 果汁 中 苦味 的 专利 ( Chemical Engineering, 1986 
年 2 月 3 H). 从 理论 上 来 说 , 利用 这 种 方法 , 几乎 可 以 把 所 有 的 苦味 去 除 掉 , 但 是 实际 上 USDA 能 
达到 去 除 50% 的 苦味 . 假设 USDA 发 言 人 宣称 去 除 一 杯 8 沽 司 新 鲜 压榨 果汁 中 苦味 的 百分率 是 服从 
均值 为 50. 1、 标 准 差 为 10. 4 的 正 态 分 布 . 为 了 检 
验 这 个 声明 , 把 这 种 去 除 苦味 方法 应 用 于 一 杯 随 
机 选取 的 8 盎司 果汁 . 假设 声明 是 正确 的 , 求 这 
种 方法 去 除 苦味 少 于 33. 7% 的 概率 . 

f 值 Y=33.7 对 应 的 标准 正 态 随机 变 
B. 


f(z) 
A 





Z-0-5.83.7 391. -1.58 
" i 3 -24 -1 0 l 2 S 


因此 , P(Y<33.7) = P(Z< -1.58), E 5.16 rh Mum 

的 阴影 面积 等 于 0. 5 减 去 Z = 1. 58 对 应 的 面积 4. 

所 以 这 种 方法 去 除 苦 味 少 于 33. 7% 的 概率 是 ， 图 5.16 例 5.9 中 去 除 苦味 百分率 
P(Y<33.7) =0. 5 - 0. 4429 =0. 0571 少 于 33.7% 的 概率 
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参考 例 5. 9, 如果 只 检验 某 一 杯 果 汁 , 得 到 去 除 苦味 的 百分率 是 33.7. 你 是 否 会 怀疑 US- 
DA 发 言 人 的 声明 ? 
解 考虑 样本 信息 , 我 们 有 几 个 选择 . 我 们 可 以 认为 这 个 发 言 人 的 声明 是 正确 的 ， 即 用 这 种 新 
方法 去 除 苦味 的 平均 百分率 是 50. 1% , 而 我 们 观测 到 了 一 个 稀有 事件 , 它 发 生 的 概率 仅 是 0. 0571. 
或 者 , 我 们 可 以 认为 这 个 发 言 人 声明 的 平均 百分比 太 高 , 即 真正 的 均值 小 于 50. 1%. 或 者 , 也 许 o 
值 的 假定 , 或 正 态 性 的 假定 可 能 是 错误 的 . 给 出 一 个 选择 , 我 们 认为 你 会 同意 有 理由 怀疑 USDA 发 言 
人 的 声明 . 


应 用 练习 


5. 


Ci 


a 


23 无 线 技术 中 传送 延迟 . 资源 预 留 协议 (RSVP) 
最 初 是 为 建立 平稳 网 络 的 信号 连接 而 设计 的 . 在 
Mobile Networks and Applications (2003 年 12 月 ) 中 ， 
RSVP 用 于 移动 无 线 技术 ( 如 具有 无 线 上 网 LAN + 
的 PC 笔记 本 ). 模拟 研究 表明 RSVP 一 连接 的 无 线 
装置 传送 延迟 (ms) 具有 近似 正 态 分 布 , 均值 凡 = 
48. 5 ms 和 ao = 8. 5 ms. 

a. 传送 延迟 少 于 57 ms 的 概率 是 多 少 ? 

b. 传送 延迟 在 40 和 60 ms 之 间 的 概率 是 多 少 ? 


-24 天 然 气 的 消费 量 和 温度 . Transactions of the 


ASME(2004 年 6 月 ) 提 出 了 一 个 预测 城市 地 区 天 然 
气 日 消费 量 的 模型 , 这 个 模型 的 一 个 重要 因素 是 
该 地 区 日 温度 的 分 布 . 基于 在 阿根廷 首都 布 宜 诺 斯 
艾 利 斯 收集 的 从 1994 年 到 2000 年 7 月 份 的 日 温 
BE, 研究 人 员 证 明 7 月 份 日 温度 是 w= 11% #ll = 
3. VC 的 正 态 分 布 . 假定 你 想 用 温度 预测 布 宜 诺 斯 
艾 利 斯 未 来 7 月 份 某 一 天 的 天 然 气 消费 量 . 
a， 如 果 你 知道 7 月 份 温度 低 于 9% 的 可 能 性 , 那么 
就 可 以 得 到 一 个 准确 的 预测 . 求 感 兴趣 的 概率 . 
b. 给 出 一 个 温度 值 , 使 得 布 宜 诺 斯 艾 利 斯 7 月 份 
只 有 5% 的 天 数 超过 它 . 


'25 影印 机 的 摩擦 力 . 参考 练习 5.8, Journal of En- 


gineering for Industry( 1993 年 5 月 ) 关 于 送 纸 间隔 的 
研究 . 假定 某 种 复印 机 系统 的 摩擦 系数 是 j=0. 55 
和 oq 20.013 的 正 态 分 布 . ( 较 高 的 系数 对 应 较 高 的 
摩擦 程度 . ) 在 系统 运转 期 间 , 摩擦 系数 是 在 随机 
选取 的 时 间 测 量 的 . 

a. 求 摩擦 系数 落 在 0. 53 和 0. 56 之 间 的 概率 . 

b. 能 否 观测 到 一 个 低 于 0.50 的 摩擦 系数 ? 说 明 

理由 . 


.26 河水 的 碱 度 . 从 韩国 首尔 汉 河 收集 的 水 样品 的 


碱 度 均 值 为 50 mg/L, 标准 差 为 3.2 mg/L ( Enviro- 
mental Science & Engineering , 2000 年 9 FJ ). 假定 碱 
度 分 布 是 近似 正 态 的 , 求 从 河中 收集 的 水 样品 有 


e 


Cn 


a 


以 下 碱 度 的 概率 : 

a. 每 升 超过 45 mg. 

b. 每 升 小 于 55 mg. 

c. 每 升 在 51 和 52 mg Z [B]. 

27 污染 鱼 的 重量 . 参考 美国 陆军 工兵 部 队 关于 田 
纳西 河 污染 鱼 的 数据 , 保存 在 DDT 文件 中 . 回顾 对 
于 每 一 条 捕 到 的 鱼 , 其 中 测量 的 一 个 变量 是 重量 
(g). 数据 集中 的 重量 可 以 证 明 是 均值 为 1 050 g、 
标准 差 为 375 g 的 近似 正 态 分 布 . 从 数据 集中 随机 
选取 一 个 观测 值 , 观测 鱼 的 重量 . 

a. 求 重量 落 在 1 000 和 1400 g 之 间 的 概率 . 

. 求 重量 落 在 800 和 1 000 g 之 间 的 概率 . 

. 求 重 量 少 于 1750 g 的 概率 . 

. 求 重量 超过 500 g 的 概率 . 

， 捕 到 鱼 的 重量 的 95% 低 于 什么 值 ? 


^? fc ° c 


.28 NHTSA 撞击 安全 测试 . 参考 练习 2.60 介绍 的 


国家 公路 交通 安全 管理 局 (NHTSA ) 关于 新 车 撞击 
测试 数据 , 保存 在 CRASH 文件 中 . 测量 的 一 个 变 
BUE 744: L1 35 mile/h 行驶 时 , 与 一 个 固定 障碍 物 
发 生 正面 碰撞 中 司机 头 部 伤害 的 严重 性 . 头 部 伤害 
级 别 点 数 越 高 , 伤害 越 严重 . 可 以 证 明 头 部 伤害 等 
级 是 均值 为 605 点 和 标准 差 为 185 点 的 近似 正 态 
分 布 . 从 数据 中 随机 选取 一 个 撞击 测试 汽车 , 观测 
司机 头 部 伤害 等 级 ， 

a. 求 等 级 落 在 500 点 到 700 点 之 间 的 概率 . 

. 求 等 级 落 在 400 点 到 500 点 之 间 的 概率 . 

. 求 等 级 少 于 850 点 的 概率 . 

， 求 等 级 超过 1000 点 的 概率 . 

.只 有 10% 的 撞击 测试 汽车 超过 的 等 级 是 多 少 ? 


oO g.0 c 


.29 野火 之 后 森林 的 生长 . Ecological Applications 


(1995 年 5 月) 发表 了 一 篇 关于 在 太平 洋 西北 部 野 
火 之 后 森林 成 长 的 文章 . 研究 人 员 感 兴趣 的 一 个 变 
量 是 火 后 110 年 树 腰 的 直径 , 已 经 证 明道 格拉 斯 杉 
树 总 体 具有 =50 cm 和 ec = 12 em 近似 正 态 分 布 . 
求 直径 d, 使 得 总 体 中 30% 的 道格拉斯 杉 树 的 直径 


连续 随机 变量 
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o 


超过 d. 

30 1 HE GGDGES Journal of Quality Technology 

(1999 年 7 月 ) 研 究 把 贵重 的 液体 注 人 容器 的 工业 

灌 装 过 程 的 特征 .每 个 容器 的 注 人 量 是 均值 为 10 

单位 、 标 准 差 为 0. 2 单位 的 近似 正 态 分 布 . 每 个 灌 

装 单位 的 成 本 是 20 美元 . 如 果 容 器 量 少 于 10 单位 

( 即 未 装 满 ), 那么 必须 重新 注 和 人 , 成 本 是 10 美元 . 

完全 装 满 的 容器 售 价 230 美元 . 

a. 求 容器 未 装 满 的 概率 . 

b. 一 个 容器 最 初 未 装 满 且 必须 重新 注 和 人， 经 再 次 
灌 装 后 含有 10.6 单位 ,对 这 个 容器 公司 的 利润 
是 多 少 ? 

c. 为 了 使 得 未 装 满 的 概率 近似 为 0, 业务 经 理 调整 
灌 装 过 程 的 均值 为 10.5 单位 . 在 这 些 条 件 下 ， 
每 个 容器 的 期 望 利 润 是 多 少 ? 

31 起 持 器 的 规格 . 起 捕 器 由 几 个 生物 医学 部 件 组 

成 , 它们 必须 是 高 质量 的 以 保证 起 搏 器 的 运转 . 对 

于 起 搏 器 制造 商 ,使 用 符合 规格 的 零件 是 很 重要 

的 . 一 个 特殊 的 塑料 零件 , 称 作 连接 器 模块 , 装 在 

起 捕 器 顶部 . 要 求 连接 器 模块 长 度 在 0.304 和 

0. 322 in 之 间 才 能 正常 工作 . 任何 一 个 长 度 不 在 这 

个 范围 内 的 模块 是 “不 合 规 格 的 ”Quality( 1989 年 

8 月 ) 报 道 一 个 连接 器 模块 供应 商 曾经 把 不 合 规格 

的 零件 供给 制造 商 达 12 个 月 . 

a. 由 供应 商 生产 的 连接 器 模块 长 度 服从 均值 为 
u =0. 3015 in, REŽA o =0. 0016 in 的 近似 正 
态 分 布 . 利用 这 个 信息 求 供应 商 生 产 不 合 规格 


9.6 判定 正 态 性 的 描述 性 方法 


在 下 面 的 章节 中 , 我 们 学 习 如 何 基于 样本 信息 对 总 体 作出 推断 ， 其 中 几 种 方法 是 基于 总 体 近 似 
正 态 分 布 的 假定 , 因此 , 在 恰当 应 用 这 些 方法 之 前 ， 确定 这 些 样本 数据 是 否 来 自 于 一 个 正 态 总 体 是 
很 重要 的 . 
可 以 应 用 几 种 描述 性 方法 来 检验 正 态 性 . 在 这 一 节 中 ， 我 们 考虑 汇总 于 方 框 中 的 三 种 方法 . 


a 


零件 的 概率 . 


b. 一 旦 发 现 这 个 问题 , 供应 商 的 监测 人 员 就 开始 ， 


使 用 为 提高 产品 质量 设计 的 自动 数据 收集 系 
St. 2 个 月 后 , 这 个 过 程 生产 的 连接 器 模块 均值 
dé u 50. 3146 in, 标准 差 是 o = 0. 0030 in. 求 将 
要 生产 不 合 规格 零件 的 概率 . 把 你 的 结果 与 a 
作 比 较 . 


.92 岩石 位 移 . 最 近 完 成 了 称 作 Carmacks Group 的 


加 拿 大 火山 岩石 的 古生物 研究 . 研究 表明 岩石 向 北 

方向 位 移 具 有 标准 差 500 km 的 近似 正 态 分 布 

(Canadian Journal of Earth Science, Vol.27, 1990). 

一 组 研究 人 员 估 计 平 均 位 移 是 1 500 km, 然而 另 一 

组 估计 平均 是 1 200 km. 

a 假定 均值 是 1 500 km, 向 北 位 移 少 于 500 km 的 
概率 是 多 少 ? 

b. 假定 均值 是 1200 km, 向 北 位 移 少 于 500 km 的 
概率 是 多 少 ? 

c， 如 果 向 北 位 移 事 实 上 少 于 500 km, 1200 km 或 
1 500 km 哪 一 个 是 更 合理 的 均值 ? 


理论 练习 
5.33 设 了 是 一 个 均值 为 j、 方差 为 o? 正 态 随机 变 
H. 证 明 ; 
了 -=- 工 -人 
o 


的 均值 为 0、 方差 为 1. (提示 :应 用 定理 
5.1~5.2.) 








确定 数据 是 否 来 自 近似 正 态 分 布 
L 建立 数据 的 相对 频率 直方 图 或 莹 时 图 . 若 数据 是 近似 正 态 的 ， 则 图 的 形状 会 与 图 5.12 正 态 曲线 类 似 


( 即 带 细 尾 的 丘 形 并 且 关 于 均值 对 称 ). 





2. 求 样本 的 四 分 位 数 间距 (IQR) 以 及 标准 差 (s), 然后 计算 IQR/s. 车 数据 是 近似 正 态 的 , 则 IQR/s =1.3. 
3， 建 立 数 据 的 正 态 概率 图 ( 见 下 面 的 例子 ). 若 数 据 是 近似 正 态 的 , 则 点 将 会 (近似 地 ) 落 在 一 条 直线 上 . 








环境 保护 署 (EPA) 对 所 有 新 车 型 推行 广泛 的 测试 以 确定 它们 的 行车 里 程 等 级 (英里 /加 


€). 表 5.1 列 出 了 某 种 新 车 型 进行 100 次 测试 获得 的 行车 里 程 等 级 数据 (数据 保存 在 EPAGAS 文件 
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中 ). 这 100 个 行车 里 程 等 级 的 数值 法 和 图 形 法 描述 性 度量 见 图 5. 17a ~ c 的 SAS 输出 . 确定 数据 是 否 
近似 正 态 分 布 . 
表 5.1 100 辆 车 的 EPA 行车 里 程 等 级 ( 英里 /加 仑 ) 


36. 3 41.0 36.9 37.1 44.9 36.8 30. 0 37.2 42.1 36.7 
32.7 37.3 41.2 36.6 32.9 36.5 33.2 37.4 37.5 33.6 
40.5 36.5 37.6 33.9 40.2 36.4 37.7 37.7 40.0 34.2 
36.2 37.9 36.0 37.9 35.9 38.2 38.3 35.7 35.6 35.1 
38.5 39.0 35.5 34.8 38.6 39.4 35.3 34.4 38.8 39.7 
36.3 36.8 32.5 36.4 40. 5 36.6 36.1 38.2 38.4 39.3 
41.0 31.8 37.3 33.1 37.0 37.6 37.0 38.7 39.0 35.8 
37.0 37.2 40. 7 37.4 37.1 37.8 35.9 35.6 36. 7 34.5 
37.1 40.3 36.7 37.0 33.9 40.1 38.0 35.2 34.8 39.5 


39.9 36.9 32.9 33.8 39.8 34.0 36.8 35.0 38.1 36.9 
— M 0 


解 ， 作 为 第 一 个 判定 方法 , 我 们 首先 检查 图 5. 17a 所 示 数 据 的 相对 频率 直方 图 , 图 中 也 附加 了 
正 态 曲线 . 很 明显 , 行车 里 程 等 级 是 近似 丘 形 的 , 以 约 37 英里 /加 仓 的 均值 为 中 心 的 对 称 分 布 . 
第 二 种 方法 ,需要 我 们 求 数据 集 的 四 分 位 数 间距 ( 即 第 75 和 第 25 百 分 位 数 的 距离 ) 以 及 标准 
25. 并 计算 这 两 个 数 的 比 . 对 来 自 正 态 分 布 的 样本 , IQR/s 近似 等 于 1.3G. IQR Il s 值 见 图 5. 17b 中 
的 阴影 部 分 , 为 IQR 22.7 以 及 s 22.42, UEH: 
IQR 2.7 


=== -].12 
$ 2.42 
由 于 这 个 值 近似 等 于 1.3, EC O! 
近 似 正 态 的 . IL NM | 


检查 正 态 性 的 第 三 种 描述 性 方法 是 正 态 — 9 T 
概率 图 . 在 正 态 概率 图 中 , 按 顺序 排列 数据 集 | | | 
中 的 观测 值 , 然后 在 数据 为 正 态 分 布 的 假定 | | 
F, 关于 观测 值 的 标准 化 期 望 值 (Z 得 分 ) 作 -ai | | 
图 . 事实 上 ， 当 数据 为 正 态 分 布 时 , 观测 值 将 | | 
近似 等 于 它 的 期 望 值 . 因此 , 正 态 概率 图 的 线 。 uu | 
性 (直线 ) 趋势 表明 数据 来 自 近似 的 正 态 分 n ， | 
布 , 而 非 线性 趋势 表明 数据 是 非 正 态 分 布 的 . | n" | 

尽管 可 以 用 手 画 出 正 态 概率 图 , 但 是 过 | f 7 | 
BRR. 用 统计 软件 可 以 容易 地 产生 这 ， = i: 
些 图 . 图 5. 17c 给 出 了 100 个 行车 里 程 等 级 i 
的 SAS 正 态 概率 图 . 注意 到 排序 后 的 测量 值 a) 行车 里 程 等 级 的 SAS 直 方 图 
合理 地 接近 一 条 直线 . 因此 , 第 三 种 方法 同 图 5.17 例 5.11 中 SAS 描述 性 统计 量 
样 表明 数据 可 能 为 近似 正 态 分 布 . 





O 你 可 以 看 到 正 态 分 布 满足 这 条 性 质 , 注意 到 相应 于 第 75 和 第 25 百 分 位 数 的 Z 值 (由 表 B.5 可 得 ) 分 别 是 0.67 和 
-0.67. 由 于 标准 正 态 (Z) 分 布 c =1, IQR/a = [0. 67 — ( -0. 67) ]/1 21.34. 
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The UNIVARIATE Procedure 
Variable: MPG 


Moments 
N 100 Sum Heights 
Mean 36.994 Sum Übservations 
Std Deviation 2.41789707 Variance 
Skewness 0.05090878 Kurtosis 
Uncorrected SS 137434.38 Corrected SS 


Coeff Variation 6.535391684 


Std Error Mean 


Basic Statistical Measures 


Location Variability 
Mean 36.99400 Std Deviation 
Median 37.00000 Var iance 
Mode 37.00000 Range 


Interquartile Range 


Quantiles (Definition 5) 


Quantile 


?75% Q3 


Estimate 


-— 1 


100 

3639.4 
5.84622626 
0.76992269 
578.7764 
0.24178971 


2.41790 
5.84623 
14.90000 
2.70000 


























T T Tos "T — qus T 
-8 -2 -1 1 2 5 
Noma Quantiles 
c) £T HUEEASAR BUS ASTE S BS] 

图 5.17 (2) 


定义 5.5 一 个 数据 集 的 正 态 概率 图 是 一 个 散 点 图 ， 其 中 一 条 轴 是 排序 后 的 数据 值 , 5 — b 
是 它们 的 相应 于 标准 正 态 分 布 的 期 望 2 得 分 . ( 注 : REES Z 得 分 的 期 望 的 计算 超出 了 本 书 范围 . 


因此 , 我 们 将 依赖 统计 软件 包产 生 正 态 概率 图 . ) 
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这 个 例子 中 给 出 的 正 态 性 检查 是 简单 、 有 效 的 方法 , 但 本 质 上 它们 只 是 描述 性 的 . 即使 当 条 件 
合理 满足 时 , 数据 可 能 (尽管 不 大 会 ) 不 是 正 态 的 . 因而 我 们 必须 小 心 , 不 要 说 表 5. 1 中 的 100 个 行车 
里 程 等 级 实质 上 是 正 态 分 布 的 . 我 们 只 能 说 有 理由 相信 数据 来 自 正 态 分布 @. 


应 用 练习 HAT l 
5.34 软件 文件 更 新 . 在 摩托 罗拉 有 限 公司 ,软件 配 。 > KPa +2o 包含 多 于 这 400 个 高 度 差 的 95%、 


置 管理 用 于 追踪 软件 工程 师 小 组 的 完成 情况 恰好 9590, IEEUP 95907 说 明理 由 . 
( Software Quality Professional , 2004 年 11 月 ). 感 兴 
趣 的 一 个 变量 是 由 于 报告 问题 而 改变 文件 更 新 的 
次 数 . 对 n=421 个 文件 的 累计 统计 得 到 以 下 结果 : 
y=4.71,s =6.09, Q, =1 以 及 Q, =6. 这 些 数 据 是 


5. 


36 小 行星 的 光谱 图 像 . 练习 2.12 中 小 行星 谱 像 
曝光 数据 在 这 里 重新 给 出 . 确定 数据 是 否 近似 





3 4 3 3 1 4 1 3 2 3 

近似 正 态 分 布 吗 ? 说 明理 由 . l. -X —W 8o oW 3 5 G 1 d 
5.35 估计 冰川 的 高 度 . 数字 高 程 模 型 (DEM ) 用 于 3 
估计 边远 区 域 的 高 度 和 坡度 . 在 Arctic, Antarctic, 6 1 3 2 2 1 2 2 4 2 


and Alpine Research ( 2004 ^E 5 月 ) 中 , 地 理学 家 分 
析 了 由 DEM 制作 的 地 图 读数 误差 . 怀特 冰川 (加 拿 
大 ) 的 DEM 地 图 的 两 个 读数 估计 了 这 个 地 区 400 
个 点 的 高 度 . 两 个 读数 估计 的 高 度 差 了 的 均值 为 
人 =0. 28 m, 标准 差 为 o =1.6 m. 了 的 直方 图 (图 中 
附加 了 正 态 直方 图 ) 在 下 面 给 出 . 


40 T- 96 


—20 


-12 -4 4 12 20 


资料 来 源 :Cogley, J. G. , and Jung-Rothenhausler, F. 
" Uncertainty in digital elevation models of Axel Heiberg 
Island, Arctic Canada," Arctic, Antarctic, and Alpine 
Research, Vol. 36, No. 2, May 2004( Fd 3). 


a. 基于 直方 图 , 研究 人 员 推断 了 不 是 正 态 分 布 ,为 





m 


a 


资料 来 源 :Binzel,R.P. , and Xu, S. “Chips off of Asteroid 4 
Vesta; Evidence for the parent body of basaltic achondrite mete- 
orites. " Science. Vol. 260, Apr. 3, 1993, p. 187( 31). 


-37 PREH. 林业 人 员 定 期 地 在 森林 中 “巡视 ”， 


以 确定 某 种 树 的 大 小 (通常 测量 树 腰 直 径 ). 不 列 
Ri SHE EC E3677 SEMIS — A 28 棵 白杨 树 样本 的 树 
腰 直 径 (m) 列 在 下 面 . 确定 样本 数据 是 否 来 自 近似 
正 态 分 布 . 


12.4 
16.6 


17.3 
16.3 


27.3 
16.3 


19.1 
21.4 
12.9 18.6 12.4 15.9 18.8 14.9 128 
24.8 26.9 13.5 17.9 132 232 12.7 
资料 来 源 : Scholz, H. “ Fish Creek Community Forest; Ex- 
ploratory statistical analysis of selected data,” Working paper, 

Northern Lights College, British Columbia, Canada. 


16.9 
25.7 


16.2 
15.0 


20.0 
19.3 


.38  34-F KRÆ FaH 8 BE. Conservation Ecology 


(2003 ^E 12 月 ) 完 成 了 关于 濒于 灭绝 的 大 马 哈 鱼 
物种 栖息 地 的 评估 . 研究 人 员 鉴 别 了 美国 俄勒冈 州 
734 个 地 点 (栖息 地 ) 的 切 努 克 ( Chinook), 银 大 马 
哈 鱼 或 虹 鲜 大 马 险 鱼 的 品种 , 并 且 给 每 一 个 栖息 
地 质量 打分 (分 数 从 0 -36, 较 低 分 数 表明 栖息 地 
供养 很 差 或 者 退化 了 ). 数据 (保存 在 HABITAT X 
件 中 ) 的 MINITAB 直方 图 在 下 面 给 出 . 数据 是 否 是 
正 态 分 布 , 给 出 你 的 观点 . 


O 可 以 用 正 态 性 的 统计 检验 提供 推断 的 可 靠 性 度量 . 然而 ， 这 些 检验 对 于 正 态 的 微小 偏离 很 敏感 ， 即 对 于 任意 一 个 不 是 
完全 对 称 和 丘 形 的 分 布 , 就 会 拒绝 正 态 性 假设 . 如 果 你 想 更 多 地 了 人 解 这 些 检 验 ， 请 查阅 有 关 文 献 . 
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Histogram (with Normal Curve) of Score 





Frequency 











55:2] 5.38 的 MINITAB 输出 
资料 来 源 : Good, T. P. , Harms, T. K., 


elshaus, M. H. “ Misuse of checklist assessments in 


and Ruck- 


endangered species recovery efforts. " Conservation 


Ecology, Vol.7, No.2, Dec. 2003( Ë] 3). 


5.39 污染 的 鱼 . 参考 美国 陆军 工兵 部 队 关于 田纳西 
河中 污染 的 鱼 的 数据 . 
a. 在 练习 5.27 中 , 假定 捕 到 的 鱼 重量 (g) 是 近似 
正 态 分 布 的 . 对 保存 在 DDT 文件 中 的 数据 , 应 
用 这 一 章 的 方法 支持 此 假定 . 
b. 保存 在 DDT 文件 中 的 另 一 个 变量 是 每 条 捕 到 鱼 
中 检测 到 的 DDT 量 (以 每 百 万 分 之 一 计 ) ,判定 
DDT 水 平 是 否 为 近似 正 态 的 . 
5.40 NHTSA 撞击 测试 . 参考 国家 公路 安全 交通 管理 


5.7 工 型 概率 分 布 
许多 随机 变量 , 如 计算 机 使 用 寿命 的 长 度 ， 


局 (NHTSA) 对 新 车 的 撞击 测试 数据 . 在 练习 5. 28 
中 假定 司机 头 部 受伤 程度 是 近似 正 态 分 布 的 . 对 保 
存在 CRASH 文件 中 的 数据 , 应 用 这 一 章 的 方法 支 
持 此 假定 . 

5.41 游船 公共 卫生 得 分 . 参考 首先 出 现在 练习 
2.15 中 的 2004 年 5 月 关于 对 174 稻 游 船 公共 卫生 
得 分 的 数据 . 数据 保存 在 SHIPSAINT 文件 中 , 评价 
公共 卫生 得 分 是 否 近 似 正 态 分 布 . 

5.42 电压 读数 . 练习 2. 14 中 , 哈里 斯 公司 两 个 地 
方 电压 读数 的 数据 在 下 面 重新 给 出 . 判定 每 个 地 方 
的 电压 读数 是 否 为 近似 正 态 的 . 








Z 地 J 新 地 J 
9.98 10.12 9.84 9.19 10.01 8.82 
10.26 10.05 10.15 9. 63 8.82 8. 65 
10. 05 9. 80 10.02 | 10.10 9.43 8.51 
10.29 10.15 9. 80 9. 70 10. 03 9. 14 
10.03 10.00 9.73 10.09 9.85 9. 75 
8. 05 9. 87 10. 01 9. 60 9.27 8. 78 
10. 55 9.55 9. 98 10. 05 8. 83 9. 35 
10.26 9.95 8. 72 10.12 9.39 9.54 
9.97 9. 70 8. 80 9. 49 9. 48 9. 36 
9. 87 8.72 9. 84 9.37 9.64 8. 68 


资料 来 源 : Harris Corporation, Melbourne , FL. 


假定 仅 取 非 负 值 . 这 种 类 型 数据 的 相对 频率 分 布 通 


常用 工 型 密度 函数 建 模 . 下 面 方 框 给 出 了 T 密度 函数 及 其 均值 和 方差 的 公式 





THES 


T 型 随机 变量 工 的 概率 密度 函数 为 : 
ES 
B'T(a) 


Ko) | 
0 





N 


Py 

Tr(a) = 
DU 型 随机 变量 的 均值 和 方差 分 别 为 : 
u = aB 


# O=y< e ;ia >0;8>0 
其 他 
[ eray 


o? - aff! 


ža 是 正 整 数 时 ,可 以 证 明 ( 证 明 略 )T(a) = (a-1)T(a-1) 以 及 T(a) =(a-1)!, 表 B.6 给 出 了 


l.0<a=2.0 时 的 TT(a) 值 . 





154 第 5 章 





r 密度 函数 公式 中 包含 两 个 参数 RU. 参数 8B 称 作 尺度 参数 , 反映 了 度量 单位 的 大 小 . ( 它 和 出 
现在 正 态 密度 函数 公式 中 的 参数 o 有 相同 的 功能 . ) 参 数 a 称 作 形状 参数 , 改变 它 的 值 会 改变 工分 布 
的 形状 , 这 使 我 们 在 建立 试验 数据 的 相对 频率 分 布 模型 时 , 能 得 到 许多 不 同形 状 的 密度 函数 . 图 
5.18 给 出 了 a=1,3 #I5, B =1 时 的 TT 密度 函数 图 形 . 





0 05 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 9,5 100^ 
图 5.18 w=1,3 和 5,8=1 时 ,T 密 度 函 数 图 形 


除了 o 为 整数 的 特殊 情况 , 我 们 不 能 得 到 T 密度 函数 积分 的 显 式 表示 . 因此 , T 随机 变量 的 累积 
分 布 函 数 称 作 不 完全 工 函数 , 必须 在 计算 机 帮助 下 用 近似 方法 得 到 . 不 完全 工 函数 表 ( 1956) 给 出 了 
这 个 函数 值 . 

在 统计 学 中 , 扮演 重要 角色 的 工 型 随机 变量 是 卡 方 随机 变量 de B. 9 给 出 了 卡 方 值 以 及 卡 方 密 
度 函 数 下 相应 的 面积 . 我 们 将 在 第 8 章 中 讨论 这 张 表 的 使 用 . 





卡 方 概率 分 布 
卡 方 随机 变量 是 w =v/2 和 B=2 HT 型 随机 变量 . 


fy) =el) De (0gy cu) 














其 中 ， 
1 
= /2 vp 
2 r(5) 
卡 方 随机 变量 的 均值 和 方差 分 别 为 : 
L= o? -2y 
参数 " 称 作 卡 方 分 布 的 自由 度 个 数 . 











当 a=1 时 ,了 密度 函数 称 作 指数 分 布 G. 这 个 重要 的 密度 函数 可 以 作为 在 某 一 服务 台 ( 计算 





O 5.3 节 中 例 5.5 和 5.6 已 经 遇 到 指数 分 布 . 
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机 中 心 、 超 市 结账 口 、 医 院 门诊 等 ) 两 个 随机 到 达 之 间 时 间 长 度 的 相对 频率 分 布 模型 ， 当 顾客 在 
任意 单位 时 间 内 到 达 的 概率 等 于 其 他 任意 时 间 到 达 的 概率 时 . 也 可 以 作为 具有 以 下 性 质 的 工业 设 
备 或 产品 的 寿命 长 度 模型 ， 当 已 知 现 在 正在 工作 的 一 个 “ 旧 ” 元 件 至 少 再 工作 i 个 时 间 单 位 的 概率 
与 一 个 “新 ”元 件 至 少 工作 :个 时 间 单 位 的 概率 相同 时 . 定期 维护 以 及 零件 更 换 的 设备 通常 显示 这 
种 “ 永 不 变 老 ” 的 性 质 . 

指数 分 布 与 泊 松 概率 分 布 有 关 . 事实 上 , 可 以 证 明 ( 证 明 略 ) 若 某 一 服务 台 到 达 人 数 服从 单位 时 
间 内 平均 到 达 人 数 等 于 1/8 的 泊 松 概率 分 布 , 则 任意 一 对 相继 到 达 之 间 的 时 间 长 度 y 的 密度 函数 将 
是 均值 为 B 的 指数 分 布 ， 即 


e B 
fo) ^B (0zy«o) 





指数 概率 分 布 
指数 分 布 是 a=1 B T 密度 函数 : 


-YB 
fo) "^. (0zy«o) 


均值 和 方差 为 : 
a-B op 











ORMA HARAR, 制造 商 知道 主要 顾客 发 生 投诉 之 间 的 时 间 长 度 Y( 月 ) 的 相对 频率 分 布 可 
以 用 w=2 和 B=4 的 工 密度 函数 建 模 . 在 制造 商 加 强 质量 控制 要 求 的 15 个 月 后 发 生 了 第 一 个 投诉 
者 . 这 能 说 明 主要 顾客 投诉 之 间 的 平均 时 间 可 能 增 大 了 ? 

解 ”我 们 希望 确定 ,如 果实 际 上 a =2 和 有 B =4, 那么 不 可 能 观测 到 了 = 15 个 月 , 或 某 个 更 大 的 了 
值 . 本 书 没 有 给 出 工 密度 函数 下 的 面积 表 , 但 是 我 们 可 以 通过 计算 a =2 和 p=4 时 T 密度 函数 的 均 
值 和 标准 差 得 到 关于 P(Y>15 ) 大 小 的 一 些 信息 . 这 样 


人 =ag=(2)(04) =8 
o2 =oB2 = (2) (4)2 =32 
g -5.7 


由 于 了 = 15 个 月 刚刚 超过 均值 一 个 标准 差 (j+o 28 5.7 213.7 A), 因此 不 能 把 15 个 月 看 作 是 了 
的 异常 大 值 . 因此 , 没有 充分 的 理由 说 明 公 司 新 的 质量 控制 方法 在 增加 投诉 之 间 的 平均 时 间 是 有 效 
的 . 在 后 面 的 章节 中 , 我 们 将 给 出 正式 的 统计 方法 回答 这 个 问题 
EERE] 证 明 ;T 型 随机 变量 了 的 均值 等 于 w = og. 

B ”我 们 首先 有 





E(Y) = d y? e "P o ,(a*1)-1 yet lee. 
(y) = | fO) = ID - Ee PEL 
用 op8 乘 且 除 这 个 积分 , 并 利用 T(a) = (a - DT Co -1) 的 事实 , 我 们 得 到 
EON) = opf? Te y = ap 六 meh 
9 (o8)Bp° T(a) o BT (a 4 1) 


被 积 函数 是 参数 为 (w+1) 和 有 的 工 密度 函数 , 因为 任何 密度 函数 在 区 间 -o «Y «oo. 上 积分 等 于 1, 得 
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5.43 金属 破碎 机 残 澶 中 的 铅 . 根据 在 全 国 收集 的 金 
属 破碎 机 的 数据 , 金属 破碎 机 残渣 中 可 提取 铅 的 
量 了 具有 均值 B=2.5 mg/L 的 近似 指数 分 布 ( 佛 罗 
里 达 破 碎 机 协会 ). 

a. 求 了 大 于 2 mg/L 的 概率 . 

b. 求 了 小 于 5 mg/L 的 概率 . 

5.44 洪水 流量 分 析 . 研究 人 员 发 现 宾夕法尼亚 州 哈 
里 斯 堡 的 萨 斯 奎 哈 纳 河 每 4 年 最 大 洪水 流量 (每 秒 
百 万 立方 英尺 ) 近似 服从 a =3, 8 20.07 的 工分 
布 .( Journal of Quality Technology, 1986 年 1 H. ) 
a. 求 萨 斯 奎 哈 纳 河 每 4 年 最 大 洪水 流量 的 均值 和 

方差 . 

b. 研究 人 员 从 1890 年 开始 , 通过 观测 每 4 年 最 大 
洪水 流量 , 得 到 了 关于 最 大 洪水 流量 分 布 的 结 
论 . 假定 在 下 一 个 4 年 周期 , 观测 到 的 最 大 洪水 
流量 是 每 秒 0. 60 百 万 立方 英尺 . 由 w = 3， B= 
0.07 的 工分 布 你 期 望 观测 到 一 个 这 么 高 的 值 
吗 ? 对 于 观测 的 4 年 间 最 大 洪水 流量 的 分 布 ， 
你 能 推断 出 什么 ? 

5.45 野火 之 后 森林 的 生长 . 参考 练习 5. 29, Ecolog- 
ical Applications ( 1995 年 5 月 ) 关 于 野火 之 后 110 年 
的 森林 生长 . 发 现 另 一 树种 , 西部 铁 杉 的 树 腰 直 径 
分 布 似乎 是 6 =30 cm 的 指数 分 布 . 求 110 年 前 遭遇 
野火 筑 损 森 林 中 生长 的 西部 铁 杉 树 腰 直径 超过 
25 cm 的 概率 . 

9.46 WAFER. 由 于 缺乏 港口 设施 或 者 浅 
水 ,需要 把 装载 在 大 船上 的 货物 用 小 型 驳船 运送 
到 码头 . 这 个 过 程 可 能 需要 小 型 驳船 从 船 到 岸 来 回 
地 往返 很 多 次 . 研究 人 员 G. Horne( 海 军 分 析 中 心 ) 
FN T. Irony( 乔治 华盛顿 大 学 ) 开发 了 这 种 运送 过 程 
模型 ,可 以 估计 船 岸 闻 的 运送 时 间 . ( Naval. Re- 
search Logistics, Vol. 41, 1994. ) 他 们 用 指数 分 布 作 
为 小 型 驳船 到 达 码 头 之 间 的 时 间 . 

a 假定 到 达 码 头 之 间 的 平均 时 间 是 17 min. 给 出 这 
个 指数 分 布 的 a 和 有 值 . 面 出 分 布 . 

b. 假定 在 码头 只 有 一 个 卸货 区 域 可 供 小 型 驶 船 使 
Hi. 如 果 第 一 条 驶 船 在 上 午 10 点 靠 码头 ， 直 到 
上 午 10: 15 ARZ, RP ARREK EEK 
R, 在 靠 码头 之 前 必须 等 待 的 概率 是 多 少 ? 

5.47 ”柔性 加 工 系统 . 在 一 个 柔性 加 工 系 统 (FMS) 
中 , 零件 加 工 要 经 历 一 系列 操作 , 其 中 有 些 是 串 行 
的 , 有 些 是 并 行 的 ,而 且 还 可 以 由 其 他 机 器 处 理 
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文章 给 出 了 有 4 个 独立 操作 机 器 的 FMS 的 例子 . 

每 台 机 器 的 修理 速度 , 即 修理 一 台 失 效 机 器 所 需 

的 时 间 (h) 分 别 是 均值 为 由 =1, =2,u, =0.5 以 

Ku, =0.5 的 指数 分 布 . 

- 求 机 器 1 修理 时 间 超 过 1 的 概率 . 

- 对 机 器 2 重复 a. 

.对 机 器 3 和 4 重复 a. 

. 如果 4 台 机 器 同时 失效 , 求 整个 系统 修理 时 间 
超过 1 h 的 概率 . 


o op 


A o0 


.48 对 众 泪 弹 的 反应 . 对 催泪 弹 配 方 A, 致使 人 


反应 所 需 时 间 长 度 Y(min) 是 a=2 和 p=2 的 T 

分 布 . 配方 B 的 分 布 是 a=1 和 p=4 的 工分 布 . 

a. 求 对 催泪 弹 配 方 A 致使 人 反应 所 需 平均 时 间 长 
度 . 求 配方 B 的 平均 值 . 

b 求 两 个 分 布 的 方差 . 

c， 哪 种 催泪 弹 在 不 到 1 min 内 使 人 产生 反应 的 概 
率 较 高 ? (提示 : 你 可 以 利用 以 下 事实 : 

[yeay = — 2ye”? + f2e7?ay 


这 个 结论 由 分 部 积分 导出 . ) 


“49 查找 软件 编码 错误 . 在 查找 和 校正 软件 编码 错 


误 ( 调 试 ) 以 及 判定 编码 的 可 靠 性 时 , 计算 机 软件 
专家 注意 了 直到 发 现下 一 个 编码 错误 所 用 时 间 分 
布 的 重要 性 . 假定 这 个 随机 变量 是 参数 a=1 的 下 
分 布 一 个 计算 机 程序 员 认为 找到 编码 错误 之 间 的 
平均 时 间 是 8 = 24 X. 假定 今天 发 现 一 个 编码 
a. [BOE B =24, 求 为 发 现下 一 个 编码 错误 至 少 需要 
60 天 的 概率 . 
b， 如 果 至 少 需 要 60 天 发 现下 一 个 编码 错误 ,对 于 
程序 员 的 检 出 编码 错误 之 间 的 平均 时 间 是 8 = 
24 天 的 声明 , 你 能 推断 出 什么 > 为什么? 


-50 CD-ROM 的 可 靠 性 . Reliability Ques (2004 年 3 


月 ) 指 出 在 双 了 驱动 器 系统 中 的 CD-ROM 驱动 器 的 寿 

命 长 度 可 用 指数 分 布 建 模 . 两 个 CD-ROM 驱动 器 是 

独立 运转 的 , 为 了 系统 成 功 运转 ,至 少 有 一 个 驱动 

器 必须 运转 两 个 驱动 器 的 平均 寿命 长 度 为 

25 000 h. 

a HA CD-ROM 驱动 器 可 靠 性 R(t) 是 驱动 器 寿命 
长 度 超过 ch 的 概率 . 给 出 RG) 公式 . 

b. Hia 的 结果 , RAN CD-ROM 驱动 器 的 寿命 长 
度 超过 8 760 h( 一 年 运转 的 小 时 数 ) 的 概率 . 

c. XX CD-ROM 驱动 器 系统 可 靠 性 5(1) 是 至 少 一 个 
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驱动 器 寿命 长 度 超过 th 的 概率 . 给 出 SCO 的 公 
式 . (提示 :用 互补 法 则 和 两 个 驱动 器 的 运转 是 
独立 的 事实 . ) 
d. H c 的 结果 , 求 两 个 CD-ROM 驱动 器 系统 寿命 
长 度 超 过 8760 h 的 概率 . 
e. 比较 b 和 d 中 的 概率 . 
理论 练习 
5.51 假设 随机 变量 Y 的 概率 分 布 为 
cfe”? 若 y>0 
AD 其 他 
求 值 , 使 用 y) 成 为 密度 函数 . 


5.8 威 布尔 概率 分 布 


5.52 证明: 参数 为 a RIB 的 分 布 的 方差 为 p. 

5.53 设 了 是 均值 为 6 的 指数 分 布 , 证 明 : P(Y >a) = 
e “83. (提示: 求 F(a) =P(Y<a).) 

5.54 参考 理论 练习 5.6 中 新 的 比 旧 的 好 (NBU) 和 
新 的 不 如 旧 的 好 (NWU) 的 定义 . 证 明 : 指数 分 布 满 
A CNBU) RI (NWU) MRE. (这 种 “寿命 ”分布 
称 为 新 的 和 昌 的 一 样 或 无 记忆 . ) 

5.55 证 明 : T (a)=(a-l)T(a-1). 

5.56 ”我们 已 经 说 明 卡 方 随机 变量 有 a =v/2 和 p= 
2 的 工 型 密度 . 求 卡 方 随机 变量 的 均值 和 方差 . 


在 5.7 节 中 , 我 们 注意 到 T 密度 函数 可 以 用 于 描述 生产 的 元 件 、 设 备 等 寿命 长 度 (失效 时 间 ) 的 
分 布 . 为 了 同样 的 目的 ,工程 师 利 用 的 另 一 个 分 布 是 威 布尔 ( Weibull) 4145. 





威 布 尔 随机 变量 了 的 概率 密度 函数 为 : 


威 布尔 概率 分 布 


gy e # 0xy«o;o»0,8»0 


Ky) -| 





0 其 他 
n -g^r(*21) 


e^ [ree ety 





Q 











威 布尔 密度 函数 有 两 个 参数 a 和 p. 尺度 参数 B 反映 被 度量 的 随机 变量 y 的 单位 大 小 . 参数 a 是 
形状 参数 . 改变 形状 参数 a, 我 们 可 以 产生 一 个 广泛 变化 的 曲线 集合 , 作为 描述 真实 失效 时 间 分 布 的 
模型 . 当 o = 1 时 得 到 5. 7 节 中 的 指数 分 布 , 图 5. 19 给 出 了 o 和 8 取 不 同 值 时 的 威 布尔 密度 函数 . 

除了 为 许多 工业 产品 失效 时 间 分 布 提供 了 一 个 很 好 的 模型 以 外 , 威 布尔 分 布 易于 应 用 . Z BJ 
积分 布 函数 的 显 式 表 示 是 存在 的 ,可 以 用 于 求 得 威 布尔 昌 线 下 的 面积 . 例 5. 14 将 说 明 这 个 方法 . 

在 生产 制造 中 使 用 的 某 种 钻头 寿命 长 度 了 是 a =2 # = 100 的 威 布尔 分 布 . 求 钻头 在 使 
FH 8 h 内 失效 的 概率 . 
解 ” 威 布尔 分 布 的 累积 分 布 函数 为 


F(yo) = [Aa = N BY e Edy 


作 变 换 Z = Ye, 有 dz =ay*-1dy, 积分 化 简 为 : 
F(yg) =1 —e^VBa|-e-Y/B 





O JL Weibull(1951). 
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Kd 5.19 威 布尔 密度 函数 图 形 


为 了 求 y 小 于 8 h 的 概率 , 我 们 计算 : 
P(Y«8) -F(8) =1-e-()"B =1 —e7(8)⁄10 =1 _ 8 0.64 
在 表 B. 3 中 的 e 80e “5 之 间 捅 值 , RARA e 函数 的 计算 器 , RI e 709 ~0. 527. 因此 ， 
钻头 在 8 h 内 失效 的 概率 为 : 
P(Y«8) =1-e 9 21-0.527 =0. 473 
JEME £555.14, 求 钻头 的 平均 寿命 . 
解 把 a=2 和 B=100 代 入 威 布尔 随机 变量 均值 的 公式 , 得 到 


M =g“er(*+) = (00) '2r [2 22) =10T(1.5) 


HX B. 6 可 得 T(1.5) =0. 88623. 因此 , 钻头 的 平均 寿命 是 : 
u= (10)T(1.5) = (10) (0. 88623) =8. 8623 ~8. 86 h 


应 用 练习 用 5 000 h 之 内 失效 的 概率 是 多 少 ? 
5.57 航空 电路 的 寿命 马里 兰 大 学 的 工程 师 研究 了 5 58 ”钻头 寿命 , 参考 例 5.14 中 销 头 的 寿命 长 度 了 


SAT. 一 YEa-2,B-10 的 威 布尔 分 布 

儿 种 商用 航空 业 电子 设备 和 控制 系统 , 包括 飞行 | MEE, 2258.11 14 DUR 17 BEI (y) E. 画 
控制 系统 、 自 动 驾驶 仪 、 飞 行 导航 系统 以 及 信号 发 Hil Cy SO) ) 以 及 钻头 失效 时 间 分 布 图 . 

生 器 . ( The Journal of the Reliability Analysis Center , b， 计 算 失 效 时 间 分 布 的 方差 

2005 年 第 1 季度 . ) 某 一 航空 电子 供应 商 出 售 的 集 c. 求 钻头 寿命 长 度 落 在 均值 的 2h 范围 内 的 概率 . 
成 电路 的 寿命 长 度 用 参数 a=1 和 B=100000h 的 — 5.59 风 迷 模型 . 风 模型 用 于 风能 分 析 以 及 风速 极限 
威 布尔 分 布 作为 模型. 供应 商 出 售 的 集成 电路 在 使 设计 的 工程 设计 中 . 一 个 广泛 应 用 的 风速 Y(mile/ 
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s) 模型 是 参数 w = 1 和 有 = w2 的 威 布尔 分 布 , 其 中 
v( 特征 速度 ) 是 风速 分 布 的 63. 21 百 分 位 数 ( Atmos- 
pheric Environment, Vol.18, No. 10, 1984). 在 英国 
某 个 站 点 , 已 知 特征 风速 是 v=11. 3 mile/s. 用 威 布 
尔 风 模型 求 : 

a E( Y) #l o°. 

b. 风速 了 小 于 6 mile/s 的 概率 . 

c. 风速 了 大 于 10 mile/s 的 概率 . 

.60 洗衣 机 的 修理 时 间 . 基于 大 量 实验 , 洗衣 机 制 
造 商 认为 直到 需要 一 次 大 修 的 时 间 Y( 年 ) 的 分 布 
是 a=2 和 B=4 的 威 布尔 分 布 . 

a. 如果 制造 商 保证 所 有 的 机 器 在 2 年 内 不 需要 大 
É, 那么 在 此 保证 下 ， 所 有 新 的 洗衣 机 需要 修 
理 的 比例 是 多 少 ? 

b 求 直到 需要 一 次 大 修 的 时 间 长 度 的 均值 和 标准 差 . 

c. o& P(u - 2o x Y xy +20). 

d. 了 可 能 超过 6 年 吗 ? 

.61 多 普 勒 频率 量 级 . 日 本 电子 工程 师 开 发 了 一 种 
称 作 移 动 目 标 探测 器 (MTD ) 的 高 端 雷达 系统 ,是 
为 了 抗 地 面 杂 乱 回 波 、 雨 天 的 杂乱 回 波 、 鸟 和 其 他 
干扰 而 设计 的 (1EE Proceedings, 1984 年 8 月 ). BE 
究 人 员 证 明 雷 达 接收 到 信和 号 的 多 普 勤 频率 量 级 了 


5.9 B 型 概率 分 布 


m 


C 


服从 参数 a =2 和 8 的 威 布 尔 分 布 . 

a. 求 E(Y). 

b. R o. 

c. 给 出 多 普 勒 频率 量 级 了 超过 某 一 常数 C 的 概率 
表达 式 . 

9.62 银行 监控 失效 直到 银行 监视 电视 设备 失效 的 时 
间 间 隔 (维修 后 以 月 计 ) 是 w =2 和 B =60 的 威 布尔 分 
布 . 如 果 银 行 想 要 在 下 一 次 例 行 修理 之 前 发 生 故 障 的 
概率 是 0.05 , 则 设备 需要 多 久 一 次 的 定期 维修 ? 


理论 练习 
5.63 WH: 对 于 威 布尔 分 布 ， 
m -g^r( e) 


5.64 WH: 对 于 威 布尔 分 布 ， 


PO «ernst 


然后 利用 关系 o -E[((Y a) ] = E( 2) - 2 
证 明 : 
2 /or 2 2 1 
e -g^[r(*75) -r(*:)] 
5.65 WH: o =2 f 8 > 0 的 威 布尔 分 布 新 的 比 旧 的 
好 (NBU). [ 见 选 做 的 练习 5.6 中 NBU 定义 . ] 


回顾 5.7 15, T 密度 函数 为 具有 固定 下 限 但 是 可 以 无 限 大 的 随机 变量 的 相对 频率 分 布 提供 了 模型 . 与 
之 不 同 的 是 , 也 用 两 个 参数 刻画 的 密度 函数 具有 有 限 的 下 限 和 上 限 . 我 们 将 给 出 的 界限 是 从 0 到 1， 
但 是 经 过 修改 , 密度 函数 可 以 定义 在 任何 一 个 有 限 的 区 间 内 . (a =2,B=4),(e =2,8=2) 和 (a 23,8 =2) 
时 的 有 密度 函数 图 形 如 图 5. 20 所 示 . 下 面 的 方 框 中 给 出 了 Bp 型 随机 变量 的 概率 密度 函数 、 均 值 和 方差 





B 概率 分 布 
B 型 随机 变量 了 的 概率 密度 函数 为 . 
“"!(1 _ )8-1 
B(a,8) 
0 其 他 


O) -| dz Oxyxl;a»0,8»0 


其 中 ， 
MM TEN _ F(o)T(g) 
B(o,B) =f (1 y)? dy 一 T(a +B) 
有 随机 变量 的 期 望 值 和 方差 分 别 为 : 


2 


_ of 
7 C (a*B) (a *B«1) 





- 
Karp 
前 面 介 绍 过 


T(a) = | y e?dy 








且 当 是 正 整数 时 , PT(a) = (a - 1) 1. 
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图 5.20 6 密度 函数 图 形 


在 计算 机 化 智能 系统 中 , 红外 线 感 应 器 将 信息 以 不 同 的 格式 传递 给 其 他 感应 器 . 对 系统 
中 所 有 感应 器 直接 兼容 的 发 送信 号 百分数 了 服从 w =B 22 的 8 分 布 . 
a. 求 系统 发 送 的 红外 信号 有 超过 30% 对 所 有 感应 器 直接 兼容 的 概率 . 
b. 求 了 的 均值 和 方差 . 
解 
a 由 上 面 给 出 的 公式 , 了 的 概率 密度 函数 为 
a-i -1 
IO eT qa) TE O -D osya 
把 a=B=2 代入 f(y) 的 表达 式 得 ， 
fo) -EDU -y GDOyüa-y) 
T(2)T(2) (1D (10) 


我 们 要 求 的 概率 是 PY 20.30). 对 f(y) 积 分 , 有 


1 1 
P(Y > 0.30) = f 867(1 -y)dy = 6[ (y - dy 


= ST - bor} = 6{ 722 - 2⁄3 
=6| 


E - (0.3)?72 - (i - (0.3)3/3) | 








-6y(1-y) 





" 
0.30 


= 6(0. 130667) = 0. 784 
b. B 随机 变量 的 均值 和 方差 为 : 


2 





2—€. 
u= y ls 


- aß 
(a +B)2(e +B +1) 
把 a=B6=2 代 入 , 得 


连续 贿 机 变量 161 





o= (2) Q2) EE 
(2+2)2(2+2+1) (16)(5) 


B 密度 函数 的 累积 分 布 函数 F Cy) B I SE p ER. 不 完全 B ECC (1956) 46 8 TR TRI y, a 
和 有 值 所 对 应 的 函数 值 . 对 于 a 和 8 为 整数 的 特殊 情况 , 可 以 证 明 : 


a-1 -1 n 
ro) = C ay = X20) 
其 中 P(y) 是 参数 为 p 和 nm= (a+B-1) 的 二 项 概率 分 布 . 回顾 表 B. 2 给 出 的 n=5,10,15,20 和 25 时 
的 二 项 概率 的 累积 和 ,本 书 末 的 参考 文献 中 列 出 了 这 些 概率 在 更 大 范围 的 表 . 
对 于 收集 的 计算 机 芯片 (与 总 容量 成 比例 ) 使 用 时 间 的 数据 ,发 现 它 的 相对 频率 分 布 可 以 
用 a=2 和 p=4 的 8B 密度 函 数 近似 . 求 在 任意 某 时 刻 , 芯片 被 使 用 的 比例 小 于 0. 20 的 概率 . 

解 ” 芯 片 被 使 用 的 比例 小 于 p =0.20 的 概率 是 ， 


Po) = HB = Yao) 
其 中 p(y) 是 a=(a+B-1) =(2+4-1) =5 和 p=0.2 的 二 项 概率 分 布 , 因此 ， 
F(.2) = Xp() = 1 = Xp) 
对 于 n=5 和 p=0.2, Hd B. 2, 我 们 求 得 ü 
Y») = 0.737 
因此 , 在 任意 某 时 间 ， 计算 机 芯片 被 占用 小 于 20% 的 概率 是 


1 
F(0.2) =1- p(y) = 1 -0.737 = 0.263 
y=0 


=0.05 





应 用 练习 a. 求 由 于 环境 污染 和 安全 法 规 , 每 年 工厂 停产 百 


5.66 ”破译 分 组 密码 , 分 组 密码 是 一 种 加 密 算法 ,为 分 数 的 均 信和 方差 
了 安全 的 目的 , 把 一 组 周 定 长 度 未 加 密 的 文本 数 P 求 由 于 环境 污染 和 安全 法 规 , 超过 1% 工厂 停产 
据 ( 称 作 明 文 ) 转 化 为 一 组 相同 长 度 加 密 的 文本 数 的 概率 
据 ( 称 作客 文 ). 一 群 韩国 通信 工程 师 设计 了 一 种 508 激光 彩色 打印 机 修理 . 数据 处 理 公 司 每 年 硬盘 
新 的 线性 近似 方法 来 破译 分 组 密码 (JEEE Transac- 修理 预算 中 分 配给 修理 激光 彩色 打印 机 的 比例 了 
tions on Fundamentals, 2005 年 1 月 ). 研究 人 员 证 具有 参数 a =2 和 B=9 的 近似 6 分 布 . 
明了 新 算法 成 功率 Y 具 有 参数 a=n/2 和 B=N/2n a. 求 了 的 均值 和 方差 . 
的 6B 分布 , 其 中 , n 是 所 用 的 线性 近似 次 数 ，N 是 b， 对 随机 选取 的 一 年 , 计算 至 少 40% 的 硬盘 修理 
加 密 数 据 中 明文 文本 个 数 . 预算 用 于 修理 激光 彩色 打印 机 的 概率 
a. 给 出 Y 的 概率 密度 函数 . c. 每 年 至 多 10% 的 修理 预算 用 于 激光 彩色 打印 机 
b. 求 了 的 均值 和 方差. 的 概率 是 多 少 ? 


a 


c. 给 出 一 个 可 能 包含 成 功率 了 的 区 间 . 

95.67 工厂 环境 污染 停工 . 一 项 关于 工业 公司 污染 控 
制 支出 的 调查 发 现 , 由 于 环境 和 安全 法 规 , 每 年 丁 
厂 停产 的 百分数 具有 a = 1 和 B=25 的 近似 有 
分 布 . 


.69 开设 网 上 公司 . 假设 开设 网 上 公司 第 一 年 运转 


效 利 的 比例 近似 地 具有 a =5 和 p=6 的 6 密度 相 

对 频率 分 布 . 

a REL 60% 开设 的 网 上 公司 在 第 一 年 运转 中 获 
利 的 概率 . 


地 
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b. RED 80% 开 设 的 网 上 公司 在 第 一 年 运转 中 获 理论 练习 


利 的 概率 . 5.71 ”连续 随机 变量 了 是 8 分 布 , 概率 密度 为 ， 
5.70 粗粮 的 水 泥 颗 粒 . 某 种 粉 未 或 颗粒 状 产 品 的 一 连 P 
个 重要 性 质 是 它们 颗粒 大 小 的 分 布 . 例如 , IERI m fc- -»! f$0ey«l 
粒 比例 太 高 导致 包装 不 好 使 耐火 水 泥 受到 不 利 的 其 他 


影响 . G. H. Brown ( Journal of Quality Technology, 

1985 年 7 月) 证明 B 分 布 为 散装 产品 中 耐火 水 泥 蜂 R o fs, BU) XE 

粒 是 粗糙 的 比例 了 提供 了 一 个 适当 的 模型 . 假设 你 572 EH: 参数 为 和 有 的 密度 均值 为 j= 
对 控制 一 批 散装 产品 的 粗糙 耐火 水 泥 的 比例 了 感 a/(a+B). 


兴趣 , 其 中 了 是 参数 a =6 =2 的 B 分 布 . 5.73 WH: 车 了 Y 了 有 a=1 和 B=1 的 6 密度, WJ y E 

a. 求 了 的 均值 和 方差 . 区 间 0<Y<1 上 的 均匀 分 布 . 

b. 只 有 当 少 于 10% 的 耐火 水 泥 颗粒 是 粗糙 时 , 你 5.74 证明: a=2 和 pB=1 的 6 分 布 是 新 的 比 旧 的 好 
才 接 受 这 批 产 品 , 求 接受 这 批 产 品 的 概率 . (NBU).( 见 选 做 的 练习 5.6 中 NBU 的 定义 . ) 


"5.10 Z4ginóBBER EI 

E Se BL i BU AECRTAB RE 08 88 Ej EC BELA a RU tE 7 SRSEAAB FR, E T B28 48 2 pb g Zy 
外 9. 矩 母 函数 m (1) 的 关联 和 应 用 在 连续 情况 下 是 相同 的 , 现在 我 们 通过 两 个 例子 来 说 明 . 
求 工 型 随机 变量 了 的 矩 母 函 数 . 


解 ” 矩 母 函 数 为 ; 
E _ e y? le -YB _ æ ya-l yle X870) ? d yt- 1e YU (1-80] 

m(t) = Efe) = f. UG qo 7 Z =. P TG) y = |. TTG 
观察 这 个 积分 ， 从 积分 中 提出 因子 1/8" , 并 用 [BA(1 - 80 ]° 乘 和 除 这 个 积分 , 我 们 可 以 把 它 转化 为 
参数 为 a 和 B/(1 -Bi) 的 T 密度 函 数 . 因此 ， 





dy 


yt le -Y/L8/ O0 -8)] 


m(t) = = zal Bx J, (Sz) T(a) 


这 个 工 密度 函数 的 积分 等 于 1. 因此 ， 


1 
m = 1) = 
(t) = ü Ta ) ( - Bos 


UEBER 参考 例 5.18, 用 m(i) 求 1 Mur, 并 用 这 个 结果 导出 型 随机 变量 的 均值 和 方差. 


解 计算 :=0 时 的 值 , 1 阶 和 2 阶 原点 矩 为 : 
dm(t) 








-a( -B) 











名 Ed dt 1-20 =a -Bi)°+! 1:20 =apB 
和 
, _ d2m(t) _ og(a+1)( -B) _ ; 
H2 d _ (1 -Be | aS *DB 





然后 , 应 用 定理 5.4, 有 





O 4.9 节 中 讨论 过 离散 随机 变量 的 矩 和 和 矩 母 函数 . 
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o° -E(y)) -u! =u, -u =a(a+1)82 -B = ag? 
本 章 末 快 速 回顾 的 重要 公式 中 汇总 了 一 些 有 用 的 概率 密度 函数 以 及 它们 的 期 望 值 EXER 


理论 练习 

9.75 用 正 态 密度 的 矩 母 函数 m(i) 求 1 Mau. 然 
后 利用 这 些 结果 证 明 : 正春 随机 变量 的 均值 为 凡 、 
方差 为 o. 

9.76 证 明 : 自由 度 为 的 卡 方 随机 变量 的 矩 母 函 
数 是 : 

m(t) (1-21) ^"? 

(提示 : 利用 卡 方 随机 变量 有 a = v/2 和 B=2 的 TT 
型 密度 函数 . ) 


快速 回顾 


5.77 ”验证 区 间 e 生 了 <5 上 的 均匀 随机 变量 的 矩 母 
函数 是 ， 
e? - e” 
t(b —a) 
5.78 考虑 连续 随机 变量 Y, 密度 为 ， 
e” 若 y<0 

=f 其 他 
a. OR Y RRR m(t). 
b. PHI a 的 结果 , 求 了 的 均值 和 方差 





m(t) = 


重要 公式 
随机 变量 概率 密度 函数 均值 5 x 矩 母 函数 * 














(b-a)? e? _ e” 
12 (b-a) 
o e + (1202/2) 
og (1-A) ° 
1 
2 — — _ 
B (1-8) 
2v (1 -2t) -wl 








PEBRE] erue 


不 存在 显 式 表示 





均 Ay) =z asysb zz 
e Gu 2e2 
正 态 Ky)z MEL -% <y<% m 
r fo) -EE osje aB 
B*T (oa) 
指数 f) eger Ü xy « e B 
.( )om-1g-2 
卡 方 fon BIA Ox y < o v 
(>) 
RER f(y) eye UB 0<y<o ger 
_ 工 (a+B) a- _ 8B- 
B fO) SOT Ha -y)&^! a 
0zy«l «tB 
符号 汇集 
Ko) 
F(y) 


连续 随机 变量 了 的 概率 密度 函数 
连续 随机 变量 了 的 累积 分 布 函数 
整数 a 的 TT 函数 


I(a) 
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tA 
地 





本 章 总 结 提示 
。 连续 随机 变量 了 的 密度 函数 性 质 : 


(1) f(y) z0, (2)F(%)=1, P(a <Y<b) =F(b) — F(a). 
° 连续 随机 变量 的 类 型 : 195]. ES D H3, Bp AURI H. 
° 均匀 概率 分 布 是 一 个 在 某 区 间 上 均等 分 布 的 连续 随机 变量 模型 . 
° 正 态 或 ( 高斯) 概率 分 布 是 具有 带 薄 尾 的 钟 形 曲 线 的 连续 随机 变量 模型 . 
。 评估 正 态 性 的 描述 性 方法 : 直方 图 、 茎 叶 图 、IQRAs =1.3 和 正 态 概率 图 . 
。 工 型 概率 分 布 是 关于 寿命 长 度 或 等 待 时 间 的 连续 随机 变量 模型 . 
。 工 随机 变量 的 两 种 特殊 类 型 : 卡 方 随机 变量 和 指数 随机 变量 . 
° 威 布尔 概率 分 布 是 表示 失效 时 间 的 连续 随机 变量 模型 . 
° B 型 概率 分 布 是 落 在 区 间 (0,1) 上 连续 随机 变量 模型 . 


补充 练习 


5.79 ”海胆 的 咽 下 时 间 . 在 实验 室 试验 中 , 贝 里 大 学 


(佛罗里达 迈阿密 海岸 ) 的 研究 人 员 研 究 了 海胆 咽 

FRR MEE (Florida Scientist, 1991 年 夏 / 秋 ). 

给 饿 了 484 的 海胆 喂 5 em 长 的 绿色 泰 菜 藻 叶 子 ， 

发 现 平均 咽 下 时 间 是 2. 83 h, 标准 差 是 0.79 h. 假 

定海 胆 咽 下 绿色 泰 莱 薄 时间 是 近似 正 态 分 布 . 

a. 求 海胆 需要 4h 或 更 多 小 时 咽 下 一 片 5 em 长 绿 
色 泰 莱 藻 叶子 的 概率 . 

b. 求 海胆 需要 2 -3 h 咽 下 一 片 5 em 长 绿色 泰 莱 藻 
叶子 的 概率 . 

.80 ”钢管 的 砂浆 厚度 . 用 作 自 来 水 管 的 钢管 通常 在 
里 面 涂 上 水 泥 砂 浆 , 以 防止 腐蚀 . 在 加 利 福 尼 亚 供 
水 项 目 中 , 管道 涂 层 的 研究 中 ( Transportation Engi- 
neering Journal, 1979 年 11 H), 砂浆 厚度 确定 为 
7/16 in. 大 量 的 厚度 测量 值 的 均值 等 于 0. 635 in, 
标准 差 等 于 0.082 in. 如 果 厚 度 测量 值 是 正 态 分 布 ， 
则 小 于 7716 in 的 百分比 近似 是 多 少 ? 

-81 公共 汽车 站 的 时 间 延迟 , 一 辆 公共 汽车 按 规定 
每 半 小 时 在 整 点 或 半点 到 某 汽车 站 停车 . 在 一 天 结 
RET, 公共 汽车 在 每 个 30 min 后 停 运 , 但 是 由 于 早 
上 经 常 发 生 延 迟 ,公共 汽车 不 会 早 到 ,只 可 能 迟 
到 . 公共 路 线 交通 工程 师 认 为 汽车 迟到 的 时 间 长 是 
均匀 分 布 , 且 述 到 最 长 时 间 是 20 min. 

a. 如 果 工 程 师 的 声明 是 正确 的 , 公共 汽车 迟到 的 
期 望 分 钟 数 是 多 少 ? 

b， 如 果 工 程 师 的 声明 是 正确 的 , 某 一 天 公共 汽车 
迟到 超过 19 min 的 概率 是 多 少 ? 

c. 如 果 你 恰好 在 一 天 结束 时 过 半 个 小 时 到 达 公共 
汽车 站 , 并 且 必 须 至 少 等 19 min 公共 汽车 , 对 


5. 


o 


e 


于 工程 师 的 声明 , 你 得 出 什么 结论 ? 为 什么 ? 
82 等候 单轨 铁路 . 乘客 拥挤 问题 促使 大 型 国际 机 
场 安装 单轨 铁路 连接 主 停机 场 到 三 个 中 央 大 厅 A. 
B fü C. 工程 师 设 计 单轨 铁路 , 使 得 乘客 在 大 厅 B 
必须 等 候 单 轨 铁 路 的 时 间 是 0 ~ 10 min 范围 内 的 均 
匀 分 布 . 

a. 求 乘客 在 大 厅 B 必须 等 候 单轨 铁路 的 时 间 了 的 
均值 和 方差 . (假定 单轨 交通 按 顺序 从 大 厅 A, 
到 大 厅 B, 到 大 厅 C,， 再 回 到 大 厅 B, 然后 回 到 
AUT A. 然后 重复 路 线 . ) 

b. 如果 单轨 铁路 从 一 个 大 厅 到 另 一 个 大 厅 需 要 
1 min, 求 一 个 焦急 的 乘客 到 达 大 厅 B 的 单轨 车 
站 后 , 少 于 4 min 可 以 到 达 大 厅 A 的 概率 . 

83 星系 速度 研究 . 回顾 练习 2. 39, The Astronomi- 

cal Journal(1995 年 7 月 ) 关 于 星系 速度 的 研究 发现 

位 于 星云 团 A2142 的 一 个 星系 ,观测 到 的 速度 具 

有 均值 为 27 117 km/s, 标准 差 为 1280 km/s 的 正 态 

分 布 . 观测 到 一 个 速度 为 24 350 km/s 的 星系 , 评论 

这 个 星系 位 于 云 团 A2142 的 可 能 性 . 

84 蚜虫 的 蔓延 . 蚜虫 是 某 种 毛虫 , 它 的 草 延 可 以 

引起 美国 北部 地 区 森林 大 面积 的 破坏 . 我 们 知道 这 

种 类 型 蔓延 平均 每 30 年 爆发 一 次 . 假定 这 种 现象 

服从 指数 概率 法 则 , 那么 在 6 年 内 蚜虫 莫 延 灾难 爆 

发 的 概率 是 多 少 ? 


.85 机 场 出 租车 服务 模型 . European. Journal of Op- 


erational Research( Vol. 21, 1985) 发 表 了 一 篇 文章 ， 
研究 机 场 出 租车 服务 的 车 辆 - 调度 决策 . 在 系统 模 
型 中 , 作者 假定 出 租车 到 达 以 及 离开 终点 站 的 相 
继 往 返 时 间 是 独立 的 指数 随机 变量 . 假定 6 = 
20 min. 
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a 出 租车 服务 的 平均 旅途 时 间 是 多 少 ? 

b， 某 次 旅途 超过 30 min 的 概率 是 多 少 ? 

c. 两 辆 出 租车 刚刚 派出 ,两 辆 都 超过 30 min 的 概 
率 是 多 少 ? 至 少 有 一 个 出 租车 在 30 min 内 返回 
的 概率 是 多 少 ? 

9.86 喷气 式 飞 机 的 噪声 污染 . 大 城市 机 场 管理 委员 
会 正在 考虑 建立 一 个 地 方 机 场 周 围 噪声 污染 程度 
的 限制 . 现在 , 一 个 机 场 附近 区 域 的 每 架 喷 气 机 起 
飞 噪声 水 平 是 近似 正 态 分 布 的 ,均值 为 100 分 由 
(dB), 标准 差 为 6 dB. 

a 在 这 个 附近 地 区 随机 选取 -- 架 喷气 机 , 产生 的 
噪声 水 平 超过 108 dB 的 概率 是 多 少 ? 

b， 随 机 选取 一 架 团 气 机 ,产生 的 噪声 水 平 恰好 为 
100 dB 的 概率 是 多 少 ? 

e. 假设 通过 的 一 项 规章 要 求 这 个 附近 地 区 的 喷气 
机 曲 声 95% 的 时 间 低 于 105 dB. 假定 噪声 分 布 
的 标准 差 保持 相同 , 为 了 遵守 这 项 规章 平均 品 
声 水 平 必须 降低 到 多 少 

5.87 机 器 停工 期 模型 ，Jndusirial Engineering ( 1990 
年 8 月 ) 讨 论 在 模拟 研究 中 建立 正确 的 机 器 停工 其 
模型 的 重要 性 . 这 篇 文章 给 出 了 具有 下 列 性 质 的 单 
机 加 工 系统 的 模拟 结果 ， 

° 任务 到 达 时 间 间 隔 是 均值 为 1.25 min 的 指数 

分 布 . 

停工 前 机 器 运转 的 时 间 是 均值 为 540 min 的 指 

数 分 布 . 

机 器 修理 时 间 (min) 是 参数 为 w=2 和 p=30 的 

工分 布 . 

a. 求 要 处 理 的 两 项 任务 到 达 间 隔 至 多 为 1 min 的 
概率 . 

b. 求 在 停工 前 机 器 至 少 工作 720 min (12 h) 的 
概率 . 

e. 求 这 人 台 机 器 修理 时 间 的 均值 和 方差 . 解释 结果 . 

d. 求 这 台 机 器 修理 时 间 超过 120 min 的 概率 ， 

9.88 有 缺陷 的 调制 解 调 器 . 假定 某 位 数据 - 通讯 供 
应 商 运 送 的 有 缺陷 的 调制 解 调 器 比例 是 a=5 和 BB 
-21 的 近似 B 分 布 . 

a. 求 每 批 货物 中 有 缺陷 的 调制 解 调 器 比例 的 均值 
和 方差 . 

b. 随机 选取 一 批 货物 至 少 包含 30% 次 品 的 概率 是 
多 少 ? 

e. 随机 选取 一 批 货物 包含 不 超过 5% 次 品 的 概率 
是 多 少 ? 

5. 89 滚珠 轴承 的 寿命 . W. 纳尔逊 ( Journal of Quali- 


ty Technology, 1985 年 7 月 ) 提 出 对 于 产品 的 寿命 ， 

威 布尔 分 布 通常 比 指数 分 布 提供 一 个 更 好 的 描述 . 

ARAH a =1.5 和 p=10 的 威 布尔 分 布 作为 滚珠 

轴承 寿命 Y( 千 小 时 ) 的 模型 . 

a. 求 这 种 类 型 的 滚珠 轴承 服务 寿命 小 于 12. 2 千 小 
时 的 概率 . 

b. ME a =1 的 威 布尔 分 布 是 指数 分 布 . 尽管 通常 
使 用 指数 分 布 , 但 纳尔逊 称 很 少 的 产品 具有 指 
数 寿命 分 布 . 用 指数 分 布 计算 a 中 的 概率 , 并 与 
a 中 得 到 的 结果 进行 比较 

. 90 ZAZ P thh. Geological Magazine ( 1995 年 5 

月 ) 报 道 了 在 土耳其 西部 关于 变质 岩 的 化 学 分 析 . 

测量 了 20 种 岩石 样品 中 元 素 钢 的 痕 量 (每 百 万 分 

之 一 ). 数据 列 在 这 . 评价 样本 数据 是 否 来 自 正 态 

总 体 . 


o 


164 286 355 308 277 330 323 370 241 402 
301 200 202 341 327 285 277 247 213 424 
资料 来 源 : Bozkurt, E. et al. “ Geochemisty and the tectonic 
significance of augen gneisses from the southern Menderes 


Massif ( West Turkey). " Ceological Magazine, Vol. 132, No. 
3, May 1995, p.291 (€ 1). 


5. 91 水 库 中 的 沉积 物 , 地 质 学 家 已 经 成 功 地 用 统计 
模型 估计 水 库 中 沉积 物 ( 称 作 相 ) 的 性 质 ， 一 个 重 
要 的 模型 参数 是 水 库 中 相 体 的 比例 P. 为 满意 的 估 
计 忆 必须 抽样 的 相 体 数 是 近似 正 态 分 布 , w=99 和 
0 =4.3. 为 了 对 评价 99% 的 水 库 有 满意 的 己 估 计 
需要 多 少 相 体 ? 

5.92 土壤 的 保水 . 一 组 土壤 科学 家 研究 从 一 块 未 耕 
种 的 含有 粉 砂 壤 的 地 中 抽取 的 土 样 保水 性 (Soil 
Science, 1995 年 1 月 ). 在 0.1 兆 帕 斯 卡 (Mpa) 压力 
下 ， 土壤 的 水 容量 (每 立方 米 土壤 中 的 立方 米 水 ) 
确定 为 j=0.27 M z =0. 04 的 近似 正 态 分 布 . 除了 
在 0.1 Mpa 压力 下 水 含量 的 读数 ， 也 得 到 了 在 0. 
0.005, 0.01, 0.03 和 1.5 Mpa 压力 下 的 测量 值 . 考 
不 一 个 水 含量 读数 是 0. 14 的 土 样 , 这 个 读数 可 能 
在 0.1 Mpa 压力 下 得 到 吗 ? 说 明理 由 . 

9.99 4A KR. 参考 练习 2. 64， 本 题 下 面 重新 给 出 
描述 50 个 钻 悄 长度 (mm) 的 直方 图 ( 见 下 页 ). 是 
否 表明 50 个 钻 悄 长 度 来 自 一 个 近似 正 态 总 体 ? 

5. 94 参考 练习 2.65, 关于 66 个 货柜 智利 块 状 铁 矿 
石 样本 中 铁 的 百分比 数据 . 数据 保存 在 LUMPY- 
ORE 文件 中 . 评价 数据 是 否 近 似 正 态 分 布 . 
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资料 来 源 : Chin, Jib-Hua, et al. “The computer simulation 
and experimental analysis of chip monitoring for deep hole 
drilling. " Journal of Engineering for Industry , Transactions 
of the ASME, Vol. 115, May 1993, p. 187( E] 12). 


.95 左 转 弯 事 故 . 假设 我 们 正在 计数 的 事件 , 例如 
在 左 转弯 路 上 机 动车 事故 数 , 是 按照 泊 松 分 布 发 
生 的 . 如 果 在 给 定时 间 区 间 , SESD(O, 1) 内 , 恰好 
发 生 一 个 这 样 的 事件 ， 则 发 生 的 实际 时 间 是 这 个 
区 间 上 的 均匀 分 布 . 假设 在 给 定 的 30 min 时 间 内 发 
生 了 一 个 事故 . 求 在 30 min 的 最 后 5 min 时 间 发 生 
这 个 事故 的 概率 . 

.96 REHAR. 为 保证 重要 设备 的 连续 运转 , 停 
工 之 间 的 时 间 长 度 是 决定 需要 的 辅助 设备 个 数 的 一 
个 重要 因素 . 机 房 领 班 认 为 , 某 台 发 电机 停工 之 间 
的 时 间 用 均值 为 10 天 的 指数 分 布 有 很 好 的 近似 . 

a 这 个 指数 分 布 的 标准 差 是 多 少 ? 

b. 假定 领班 正确 地 描述 了 停工 之 间 时 间 的 分 布 ， 
并 且 发 电机 今天 停工 , 求 发 电机 在 以 后 的 14 天 
内 再 次 停工 的 概率 是 多 少 ? 

c 发 电机 运转 超过 20 天 没有 停工 的 概率 是 多 少 ? 

.97 化 学 杂质 . 在 某 种 化 学 产品 中 , 每 批 所 含 杂 质 
的 百分数 了 是 一 个 B 随机 变量 , 概率 密度 为 : 

90y" (1 - y) 若 0<y<1 
fa = 其 他 

a a 和 B 值 是 多 少 ? 

b. 计算 了 的 均值 和 方差. 

c. 一 批 超 过 80 和 杂质 的 产品 就 不 能 销售 . 随机 选取 的 

一 批 由 于 过 多 的 杂质 而 不 能 销售 的 概率 是 多 少 ? 


.98 存储 器 的 寿命 . 台式 电脑 存储 器 的 寿命 YCF) 


是 威 布尔 随机 变量 , 概率 密度 为 : 


5. 99 


0 其 他 
a. o 和 BB 值 是 多 少 ? 
b. 计算 了 的 均值 和 方差 . 
c. 求 一 个 新 的 存储 器 在 6 年 内 不 失效 的 概率 ? 
听觉 神经 纤维 . 参考 练习 4. 101, Journal of the 
Acoustical Society of America(1986 年 2 月 ) 关 于 猫 的 
听觉 神 经 反应 率 . 研究 人 员 提 出 一 个 重要 问题 是 存 
在 干扰 噪声 下 , 音调 产生 率 的 变化 ( 即 每 次 发 出 噪 
声 时 测试 信号 个 数 的 变化 ) 是 否 足 够 大 以 致 被 可 靠 
地 检测 到 . 也 就 是 说 ， 当 有 干扰 噪声 时 , 音调 能 否 
被 检测 到 ? 在 信号 检测 理论 中 , 这 个 问题 涉及 到 两 
个 概率 分 布 的 比较 . 设 了 表示 在 两 种 条 件 下 当 刺 激 
只 是 干扰 噪声 (N) 时 和 当 刺 激 是 音调 加 干扰 噪声 
(T) 时 ,听觉 神经 反应 率 ( 即 观测 到 的 测试 信号 
JO. 了 在 两 种 条 件 下 的 概率 分 布 分 别 由 密度 函数 
KOMABE, 其 中 我 们 假定 只 有 干扰 噪声 条 
件 下 , 平均 反应 率 小 于 音调 加 干扰 噪声 条 件 下 的 
平均 反应 率 , BI uy <Ar. 在 这 种 情况 下 , 一 个 观测 
者 设 定 一 个 阅 值 C, 并 且 如 果 Y> C, 断定 音调 存 
fr; 如 果 了 < C, 断定 音调 不 存在 . 假定 MO) 和 
AO) 都 是 正 态 密度 函数 , 均值 分 别 为 每 个 脉冲 
An =10. 1 个 信号 , 每 个 脉冲 Ar = 13.6 个 信号, H 
方差 相等 ov = of = 2. 
a. 对 于 每 个 脉冲 C = 11 个 信号 的 阔 值 , 已 知音 调 
FE, 求 检测 到 音调 的 概率 .( 称 作 检测 概率 . ) 
b。 对 于 每 个 脉冲 C = ARSKA, 已 知 只 有 
干扰 噪声 存在 , 求 检测 到 音调 的 概率 . (KEE 
警 概率 . ) 
c. 通常 , 令 人 满意 的 是 使 虚 警 概 率 达 到 最 小 值 
同时 使 检测 概率 达到 最 大 值 . 你 能 求 得 一 个 
f C, 使 得 既 增加 检测 概率 (a) 又 减少 虚 警 概 
率 (b)? 


理论 练习 
5.100 ”连续 随机 变量 Y 有 概率 分 布 为 ; 


cye "2 若 y>0 
AD = M 
a. 求 c 值 , f f( y) EROS CREE HE. 
b. o& F(y). 
c. 计算 P(Y»2.5). 


连续 随机 变量 d 





5.101 为 了 帮助 探索 预测 太阳 能 装置 效率 的 工程 A, = 晴朗 天 的 平均 日 射 量 ;As = 多 云天 的 平均 日 身 
. Wi, Olseth 和 Skartveit( Solar Energy, Vol. 33. No. 6, 量 ;w 是 权 数 , 0«w«l. 证 明 : 
1984) 研 发 了 一 个 在 中 风暴 地 带 的 海平 面 位 置 每 天 [yay - 1 
日 照 率 了 的 模型 . 为 了 说 明 " 晴朗" 和 ”乌云 密布 ”  .， "— 
天 的 情况 ， 研 究 人 员 用 两 个 修正 的 下 函数 的 线性 “510 O Y ORANAN 1 
组 合 建立 了 Y( 以 百分数 度量 ) 的 概率 密度 函数 : Naa a ee a 
=wg(y,Ài) + (1 -w)g(1 -y,Ài) ,(0 «y«1) b. "tà zE[eU?'] PN 
(1 - y)e” €. Diu) (É) -E[eO*9"*] =e“, +) 


g(y) = 
| -edy 


活动 中 的 统计 学 :超级 武器 的 开发 一 一 优化 命中 率 

美国 军队 正在 与 一 个 重要 的 国防 设备 承包 商 开 发 一 种 “超级 ”武器 . 这 种 武器 设计 一 次 射击 能 发 
射 大 量 的 杀伤 力 大 的 钨 制 子弹 ( 称 作 穿 甲 弹 ) 歼 灭 许多 敌 兵 . 穿甲弹 平均 大 约 指甲 的 大 小 , 在 一 端的 
小 鱼 能 在 飞行 中 稳定 它们 . 自 第 一 次 世界 大 战 ， 当 法 国人 从 飞机 向 地 面 军队 发 射 穿甲弹 时 , 军火 专 
家 已 经 试验 把 穿甲弹 用 于 各 类 枪 炮 . 用 穿甲弹 作为 弹药 的 一 个 问题 是 准确 性 一 一 用 现在 的 武器 发 射 
大 量 的 穿甲弹 ， 当 远 距离 发 射 时 没有 满意 的 命中 率 . 

国防 设备 承包 商 (由 于 机 密 和 安全 的 原因 ， 











在 这 里 不 给 出 名 字 ) 已 经 开发 了 一 种 光电 型 手枪 ， O que s 

在 一 次 齐 发 中 可 以 发 射 1 100 发 穿甲弹 . 在 范围 测 @ | m @ | 
试 中 , 把 3 个 2in 宽 的 靶 安 放 在 距 武 器 500 m( 近 2 2 3 @ 7 8 € [E ° 
4] 1500 f£) 的 位 置 . 用 一 条 数 直线 作为 参照 物 , 三 5 | Pu t 

Ad uode 0, 5 n 10 ñ Ab, 如 图 SIAS. 1 y-20 Y-50 

所 示 . 26878 JM Bite rh [ep fp ( rh ty fE 5 fi Ab) Sr 


并 发 射 一 次 . 用 一 个 水 平 格子 测量 1100 发 穿甲弹 

在 500 ft 远 处 的 弹 着 点 工 随机 变量 了 的 1 100 个 测量 值 保 存在 MOAGUN 文件 中 .( 由 于 机 密 的 原因 
数据 是 模拟 的 . ) 例如 水 平 值 为 Y=5.5( 如 图 SIAS. 1) 的 穿甲弹 击 中 中 间 的 靶 , 但 水 平 值 为 了 =2.0 
的 穿甲弹 (也 见 此 图 ) 没 有 击 中 三 个 靶 中 的 任何 一 个 . 

国防 设备 承包 商 对 任何 一 个 靶 被 穿甲弹 击 中 的 可 能 性 感 兴趣 , 特别 希望 设 定 使 击 中 靶 数 最 大 化 
的 手枪 规格 . 武器 设计 为 水 平均 值 E(Y) 等 于 瞄准 点 . (如 当 瞄 准 中 间 各 时, a =5 fO) , 通过 改变 规格 ， 
承包 商 可 以 改变 标准 差 o. MOAGUN 文件 包含 了 三 个 不 同 范围 测试 的 穿甲弹 的 测量 值 :一 个 标准 差 
c =1 人 ft、 一 个 go=2 丰 以 及 一 个 go =4 ft. É: Y, ,Y, M Y, DIJEN o =1,0 =2 以 及 og =4 的 水 平 测量 值 
的 随机 变量 . 

由 过 去 的 经 验 , 国防 设备 承包 商 发 现 穿甲弹 水 平 测量 值 的 分 布 非常 近似 于 正 态 分 布 . 图 SIAS. 2a ~ c 
给 出 MOAGUN 文件 中 水 平 击 中 测量 值 的 MINITAB 直方 图 . 你 可 以 看 到 附加 在 直方 图 上 的 正 态 曲线 
拟 合 数据 非常 好 . 因此 , 我 们 将 用 正 态 分 布 求 武器 发 射 的 一 个 穿甲弹 击 中 三 个 报 中 的 任意 一 个 的 概 
率 . 在 图 SIA5. 1 中 , 注意 到 , 三 个 误 的 范围 是 从 水 平 格 的 -1~1, 4~6 以 及 9~11f. 

首先 考虑 中 间 的 靶 . 仍 设 了 表示 由 手枪 发 射 的 一 个 穿甲弹 的 水 平 测量 值 . 所 以 车 4<Y<6, 则 穿 
甲 弹 击 中 靶 . 4 =5 #lo=1 HF, 由 正 态 概 率 表 ( 表 B.5), 这 个 穿甲弹 击 中 靶 的 概率 是 : 


168 $53 





dirlo - 1) :P(4<Y<6) P [S < z < 65) =P( -1«Z«1) =2(0.3413) =0. 6826 


类 似 地 , 求 得 穿甲弹 击 中 如 图 SIAS. 1 所 示 的 左边 和 右边 靶 的 概率 ， 


击 中 左边 杷 (=1):P( -1<Y<1) =P[ = = < z< 1) &nf -&eE e d esl 


1 1 
击 中 右边 靶 (o -1);P(9«Y«l1) pe =P(4<Z<6)=0 
可 以 看 到 穿甲弹 大 约 有 68% 的 机 会 击 中 中 间 的 靶 ， 但 事实 上 ， 当 标准 差 设 定 为 1 在 时 , 穿 甲 子弹 没 


有 机 会 击 中 左边 和 右边 的 靶 . 
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c) Mo =4 时 , 水 平 击 中 测量 值 的 MINITAB 直方 图 
图 SIA5.2 ogo=1,g=2 和 og=4 时 ， 水 平 击 中 测量 值 的 MINITAB 直方 图 


为 7 求 g=2 和 c=4 时 的 三 个 概率 值 , 我 们 用 MINITAB 中 的 正 态 概 率 函 数 . 图 SIA5.3 是 
MINITAB TER, 给 出 了 正 态 随机 变量 落 在 第 一 列 中 了 值 以 下 的 累积 概率 . 0-2 Ho =4 时 的 累积 
概率 分 别 在 Sigma2 和 Sigma4 列 中 给 出 . 

用 图 中 的 累积 概率 求 o = 2 时 的 三 个 概率 , RIA: 
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击 中 中 间 靶 (c 22): P(4<Y<6) = P(Y«6) - P( Y<4) =0. 6915 -0. 3085 =0. 3830 
击 中 左边 靶 (c =2):P( -1<Y<1)=P(Y<1) -P(Y« -1) =0.0227 -0.0013 20.0214 
击 中 右边 靶 (o=2): P(9<Y=11) =P(Y<11) - P( Y<9) =0.9987 -0.9773 =0. 0214 





所 以 当 o =2 81, FERRAR 38% 的 机 会 击 中 中 间 —asamasmanmaamamasumaaqan 
KWE, 2% 的 机 会 击 中 左边 的 靶 , 以 及 2% 的 机 会 击 中 | Y | Sigmat Sigma Sigma | — 





右边 的 靶 . 穿甲弹 击 中 中 间 、 左 边 或 者 右边 靶 的 概率 > Tue USD 让 
是 这 三 个 概率 的 简单 求 和 (概率 加 法 规则 的 应 用 ) 这 O I diss 0022750 0190059 
个 和 是 0. 3830 + 0. 0214 + 0. 0214 = 0. 4258; 因此 ， 当 4 6 0.84134 0.691462 0.598706 
i 22H Zu nH Z 5 9 0.99997 0.977250 0.841345 
— A F d 穿甲弹 大 约 有 和 2% 的 机 会 击 中 t 11 1.00000 0.998650 0.933193 
| Jai ps > 
lll SIAS. 3 中 的 累积 概率 求 o =4 时 图 SIA5. 3 累积 正 态 概 率 MINITAB THX 
=A AS 


击 中 中 间 靶 (c=4): P4 «Y«6) = P(Y«6) - P(Y«4) =0. 5987 - 0. 4013 =0 1974 
击 中 左边 靶 (c 24): P( -1<Y<1) 2 P(Y«1) - P(Y« -1) 20. 1587 - 0. 0668 =0. 0919 
击 中 右边 靶 (o=4): PI9«Y«11) - P(Y«11) - P(Y«9) -0.9332 — 0. 8413 =0. 0919 
所 以 当 c =4 BF, 穿甲弹 大 约 有 20% 的 机 会 击 中 中 间 的 靶 , 9% 的 机 会 击 中 左边 的 靶 , 以 及 9% 的 机 
会 击 中 右边 的 靶 . 穿甲弹 击 中 三 个 靶 中 任意 一 个 的 概率 是 ;0. 1974 +0.0919 +0.0919 =0. 3812. 
K SIAS. 1 给 出 对 不 同 的 e 值 , 计算 击 中 三 个 靶 的 正 态 概率 , 也 给 出 了 三 个 范围 测试 的 实际 结果 
(回顾 保存 在 MOAGUN 文件 中 的 实际 数据 ). 你 可 以 看 到 1 100 发 穿甲弹 实际 击 中 每 一 个 靶 的 比例 
( 称 作 击 中 率 ) 与 用 正 态 分 布 估 计 的 击 中 率 非常 接近 . 


R SIA5. 1 正 态 概率 计算 与 实际 范围 测试 结果 汇总 表 





H b 规 格 正 态 概率 实际 击 中 次 数 击 中 率 ( 击 中 次 数 /1 100) 
左 ES! 0. 0000 0 0. 000 
a -2 0. 0214 30 0. 027 
g =4 0. 0919 73 0. 066 
中 间 c -l 0. 6826 764 0. 695 
a -2 0. 3820 409 0. 372 
og =4 0. 1974 242 0. 220 
dü o -1 0. 0000 0 0. 000 
é=} 0. 0214 23 0. 021 
g -4 0. 0919 93 0. 085 
k——= s R rm. 


这 些 概率 值 的 计算 揭示 了 一 些 规律 . 首先 , dh p Ege CTHAOBEHER AO) 的 概率 随 着 标准 差 的 增 
大 而 减 小 . 显然 ,如 果 美国 军队 想 使 光电 型 手枪 击 中 瞄准 靶 的 机 会 极 大 化 ， 那么 手枪 规格 应 设置 为 
一 个 小 的 o 值 . 但 如 果 军 队 想 在 武器 的 一 次 射击 中 击 中 多 个 靶 ，c 应 当 增 大 . c 越 大 , 并 不 是 击 中 有 瞄 
准 思 的 穿甲弹 越 多 , 而 是 击 中 周围 的 靶 越 多 . o 是 否 应 当 设 置 为 4 或 6( 或 一 些 其 他 值 ) 依赖 于 对 周转 
靶 要 求 的 击 中 率 有 多 高 . 


第 6 m ”二 元 概率 分 布 及 抽样 分 布 


目标 介绍 二 元 概率 分 布 、 协 方差 和 独立 性 的 概念 ; 说 明 如 何 求 随机 变量 线性 函数 的 期 望 值 和 
方差 ; 求 出 并 识别 统计 量 的 概率 分 布 ( 抽样 分 布 ). 


6. 1 二 元 离散 随机 变量 的 概率 分 布 


工程 师 负 有 用 多 个 变量 来 估计 道路 建设 花费 的 责任 . 例如 ， 两 个 重要 的 离散 随机 变量 是 要 建造 
的 桥 的 数量 X 和 需要 拆迁 的 建筑 物 数量 Y. PE4E X A Y 取 某 些 值 的 概率 是 给 出 精确 预算 的 关键 . 

在 第 3 章 中 , 我 们 学 习 了 两 个 事件 交 ( 即 两 个 事件 4 和 8B 都 发 生 ) 的 概率 等 于 

P(AnB) -P(A)P(B|A) =P(B)P(A|B) 

如 果 我 们 对 样本 空间 中 的 每 个 点 指定 两 个 数 , 一 个 相应 于 离散 随机 变量 不 的 值 ( 如 要 建造 的 桥 
的 个 数 ) ,一 个 相应 于 离散 随机 变量 了 的 值 (如 要 拆迁 的 建筑 物 的 个 数 ), 那么 三 和 了 了 的 具体 值 就 相 
应 于 两 个 数值 事件 . 可 以 得 到 这 两 个 事件 交 的 概率 , 用 符号 4 表示 X, 用 符号 B So Y; 

P(ANMB) =P(X=x,Y=y) =p(x,y) 
=pi(x)p;(y | x) 
=p. (y)pi (x |y) 

注 : 为 了 区 分 概率 分 布 ， 当 提 及 不 的 概率 分 布 时 我 们 通常 用 下 标 lI(de pj) cn, SEA Y 2 
dp B] J] T F 2 ( +e p, ) s. 

给 出 X 和 Y 所 有 值 的 交 (x,y) 概 率 的 表 、 KRAE RE X A Y 的 联合 概率 分 布 . 概率 分 布 p. (x) 
给 出 了 观测 到 子 为 待定 值 的 概率 ; 同样 地 ,pz (y) 给 出 了 离散 随机 变量 了 的 概率 . 因此 ,Pi (x), 
Pa(y) 分 别称 作 瑟 和 了 的 边缘 概率 分 布 , 是 第 4 章 提 到 的 离散 随机 变量 的 无 条 件 概率 分 布 . 

定义 6.1 两 个 离散 随机 变量 五 和 了 的 联合 概率 分 布 p (x,y) HEITI) EA X p Yiia 
每 个 组 合 给 出 p(x,y) 值 的 表 、 图 或 公式 . 





3 X # Y 的 离散 二 元 概率 分 布 应 满足 的 要 求 
l. X PUR X fo Y f, 0<p(x,y) «1. 


2. > Y p(x,y) = I. 


注 : 符号 》 V 表示 对 于 和 了 的 所 有 值 求 和 











考虑 两 个 离散 随机 变量 X 和 Y, 其 中 X=1 或 X=2, Y=0 或 Y=1. 了 和 了 的 二 元 概率 分 布 
定义 如 下 : 
p(x,y) = 


WR: 它 满足 离散 二 元 概率 分 布 的 性 质 ( 要 求 ). 
解 ” 因 为 X 取 两 个 值 (1 或 2) ,了 取 两 个 值 (0 或 1), 所 以 了 和 了 有 2 x2 =4 个 可 能 组 合 . 这 4 对 


0.25 +x 一 YY 
5 
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(x,y)d&(1,0) , (1,1), (2,0), 和 (2, 1). 把 这 些 XY 和 了 的 可 能 值 代入 p(x,y) AR, 得 到 下 面 的 联 


合 概率 : 
p(1,0) O3 1-0 co, 25 


0. 05 


0.25 «1-1 
p(1,1) = 一- 


0.2542-0 - 
e = 


p(2,0) = 0.45 


p(2,1) "028 12-1. 9.35 

注意 到 ,这 些 联合 概率 的 每 一 个 值 都 在 0 和 1 之 间 ( 满 足 给 出 的 条 件 1), 并 且 这 4 个 概率 之 和 等 于 1 
(满足 条 件 2). 
考虑 表 6. 1 给 出 的 二 元 联合 概率 分 布 , 每 个 单元 中 的 数字 是 相应 于 离散 随机 变量 了 和 了 
每 一 对 值 的 p(x,y) 值 , 其 中 X=1,2,3,4,Y=0,1,2,3. 例如 ， 表 6.1 X 和 的 二 元 概率 分 布 
在 一 个 柔性 加 工 系 统 , X 表示 可 用 的 机 器 台数 , Y ERMI 
一 个 零件 需要 的 相继 作业 数 . 求 离散 随机 变量 的 边缘 概率 
分 布 pi Cx). 

解 为 求 下 的 边缘 概率 分 布 , 我 们 需要 求 P(X=1),P 
(X 22) ,P(X 23) RI P(X 24). 因为 当 了 =0,1,2,3 发 生 时 ， 
X=1 都 可 能 发 生 , 那么 P(X=1) =pi(1) 就 可 以 将 4 个 相互 
排斥 事件 的 概率 相 加 得 到 ; 

P(X=1) =p1(1) 2p(1,0) +p(1,1) +p(1,2) +p(1,3) 
代入 表 6. 1 给 出 的 p(x,y) 值 得 到 : 
P(X=1) =p (1) =0 +0.03 +0.05 +0=0.08 

注意 , 这 个 边缘 分 布 是 对 表 6. 1 rp X = 1 这 一 列 的 概率 求 和 得 到 的 . 类 似 地 ， 

P(X=2) =p (2) =p(2,0) +p(2,1) +p(2,2) +p(2,3) =0. 10 40.07 +0. 10 +0. 10 20. 37 

P(Xz3) 2p, (3) =p(3,0) +p(3,1) +p(3,2) +p(3,3) 20.20 «0.10 +0.05 +0. 05 =0. 40 

P(Xz4) 2 p4(4) 2 p(4,0) +p(4,1) +p(4,2) +p(4,3) =0.10 +0.05 +0 +0 =0. 15 
下 表 给 出 边缘 概率 分 布 pj (x) : 


x 1 2 3 4 


X-x 





1 2 3 4 
0 010 0.20 0.10 
0.03 0.07 0.10 0.05 


< 
II 
M 


0.05 0.10 0.05 0 


Q N = eG 





0 0.10 0.05 0 





pi (z) 0.08 0.37 0.40 0.15 


从 表 中 可 以 看 出 2 pi(x) = 1. 
例 6. 2 证 明了 高 散 随机 变量 的 边缘 概率 分 布 可 由 对 所 有 Y 值 的 p(x,y) 求 和 得 到 . 这 个 结果 总 
结 在 下 面 . 
定义 6.2 设 半 和 了 是 离散 随机 变量 , p(x,y) 是 它们 的 联合 概率 分 布 ， 则 站 和 了 的 边缘 (无 条 
件 ) 概 率 分 布 分 别 为 ; 
pO) = Xpy) 和 pO) = Xp) 





注 : 我 们 用 符号 》 表示 所 有 了 了 值 的 和 . 

在 给 定 事件 了 发 生 的 条 件 下 , 数值 事件 的 概率 是 给 定 Y=y 时 X 的 条 件 概率 ， 对 所 有 了 值 给 出 
这 些 概 率 的 表 、 图 或 公式 , 称 作 给 定 了 时 无 的 条 件 概率 分 布 ， 并 用 符号 pi (x | y) dom. 
回顾 例 6. 2, 求 给 定 了 = 2 时 , X 的 条 件 概率 分 布 

解 的 条 件 概率 分 布 有 4 个 , 每 个 了 值 对 应 一 个 . 由 第 3 章 知 ， 

.P(AnB) 
P(A|B)- P(B) 

如 果 令 一 个 工 值 对 应 于 事件 4, 一 个 了 值 对 应 于 事件 B, 那么 就 有 


y ly aR) 
pi |y) pi y) 
或 当 Y=2 时 ， 
_ p(x,2) 
pila |2) p. (2) 
因此 ， 
.p(1,2) 
p(112) p, (2) 
由 表 6.1, 我 们 得 到 p(1,2) 20.05 I P(Y -2) =p2(2) 20.2. 所 以 ， 
.p(1,2) 0.05 _ 
p (1|2)= nO) "0:29 70-25 
类 似 地 ， 
_ 0.10 


_p(2,2) 0.10 _ 
p (2 |2) "SQ 70.29 = 0. 50 


_p(3,2) 0.05. 
p (3 |2) p, (2) 70.20 o^ 9.25 


2 
_p(4,2) 0.0 
m (412) «m 0.2 


因此 , 在 给 定 Y=2 时 , X 的 条 件 概率 分 布 如 下 表 所 示 : 


x 1 2 3 4 





p (x |2) 0.25 0.50 0.25 0 


由 例 6. 3 注意 到 , 对 X 的 所 有 取 值 ， 条 件 概率 pl (x |2) 之 和 等 于 1. 因此 , 条 件 概 率 分 布 满 足 所 
有 概率 分 布 必须 满足 的 要 求 : 
pi(x|y) 宇 0 和 È p (z]y) = 1 
类 似 地 ， 
p(yl|x) 20 和 X p.(y | x) = 1 
定义 6.3 Xf 了 是 离散 随机 变量 ， P(X%,y) 为 它们 的 联合 概率 分 布 , 则 于 和 了 的 条 件 概率 分 
布 定 义 如 下 : 


x | y S BC. y) P(x,y) 
pi(x|y) pa) 和 paly |x) pC 
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在 前 面 的 讨论 中 , 我 们 定义 了 两 个 离散 随机 变量 X 和 了 的 二 元 联合 边缘 和 条 件 概率 分 布 . 这 个 
概念 可 以 推广 到 任意 个 随机 变量 .因此 , 对 样本 空间 中 的 每 一 个 点 , 我 们 可 以 定义 第 三 个 随机 变量 
W. 联合 概率 分 布 p(x,y,w) 是 给 出 对 所 有 X,Y 和 WW 值 的 组 合 , 交 事件 (x,y,w) 发 生 的 p(x,y,w) 值 
的 表 、 图 或 公式 . 一 般 地 , 两 个 或 更 多 个 随机 变量 的 联合 概率 分 布 称 作 多 元 概率 分 布 . 尽管 本 章 剩余 
部 分 致力 于 二 元 概率 分 布 , 但 这 个 概念 也 适用 于 一 般 的 多 元 情况 . 


(2) 应 用 练习 








(E) 


TAA FLIER HEBES 





6.1 IF-THEN 软件 代码 . 设计 一 个 软件 项 目 完成 两 试 验 工件 材料 (m) CRRI) (英寸 / 转 ) 
个 任务 (4 和 B). iX EIES A 代码 中 IF-THEN ; P. 02s 2500 0 00s 
语句 的 个 数 , 了 表示 任务 B 代码 中 IF-THEN 语句 
的 个 数 . 两 个 离散 随机 变量 的 联合 概率 分 布 p(x， 6 钢 0.125 — 4000 0.0065 
PEFR PAH. 7 钢 0. 125 4 000 0. 009 

8 钢 0. 125 3 000 0.010 
X 
|o 10 2 3 4 5 假定 列 出 的 两 项 机 器 条 件 在 自动 系统 中 出 现 缺 陷 ， 









0.050 0.025 0 0.025 0 


Y 1 |10.200 0.050 0 0.300 0 0 


0 0 0.100 0.150 





验证 满足 联合 概率 分 布 的 性 质 . 


定义 于 为 这 两 项 条 件 钢 料 的 机 器 台数 , 了 为 这 两 项 
条 件 中 25 in 钻头 的 机 器 台数 . 

a. 求 二 元 概率 分 布 p(x,y). 

b. 求 边缘 概率 分 布 p. Cy). 

c. 求 条件 概 率 分 布 p. (x | y). 


a. 6.4 机 器 人 传感器 系统 配置 . 参考 练习 4. 5 在 未 知 环 
b. 求 下 的 边缘 概率 分 布 pn (x). 境 中 机 器 人 传感器 系统 的 研 

c. 求 了 的 边缘 概率 分 布 piCy). 究 (The International Journal 

d. RRR p(x | y). 


e. 求 条 件 概率 分 布 p, (y | x). 

.2 WRT. 考虑 搁 一 对 般 子 的 试验 . EX ROB 
颗 仍 子 的 结果 ( 即 出 现 于 上 面 的 点 数 ) , 了 是 第 二 颗 
BT. 

a. 求 联合 概率 分 布 p(x,y). 

b. 求 边缘 概 率 分 布 p,(x) fll p, (y). 

e. 求 条 件 概率 分 布 p(x | y) fi p(y | x). 

d. 比较 b 和 * 的 概率 分 布 , 你 观测 到 什么 现象 ? 

.3 自动 钻 孔 机 . 参考 练习 3.57, 关于 自动 销 孔 机 
的 研究 (Journal of Engineering for Industry,1993 年 8 
A), 用 于 研究 中 的 8 台 机 器 的 条 件 在 这 里 重新 
给 出 . 





of Robotics Reath , 2004 年 12 
A), 在 如 右 图 所 示 的 三 点 
式 、 单 连接 机 器 人 系统 中 ， 
系统 中 每 一 个 点 (4、B 或 C) 
或 者 处 于 “障碍 ”状态 , 或 者 
处 于 “自由 ”状态 . X 48 连接 有 一 个 “障碍 ” 令 
X=1; 若 连 接 是 “自由 ”的 ( 即 没有 障碍 ) , 2 X = 
0. 类 似 地 , 若 BoC 连接 有 -一 个 “障碍 ”, 令 了 = 1, 
若 连接 是 “自由 ”的 , 令 了 = 0. 回想 研究 者 假定 系 
统 中 每 个 点 处 于 “自由 ”位 置 的 概率 是 0.5 , 3EH 
系统 中 三 个 点 独立 运转 . 

a 以 表格 形式 给 出 和 了 的 联合 概率 分 布 

p(x,y). 








` ; 、 b. 求 条 2 ix . 
1 铸铁 0.25 1250 0. 011 6.5 卡车 道上 的 红 灯 , 一 辆 专门 送 货 的 卡车 每 天 从 
2 铸铁 0.25 1 800 0. 005 点 4 行 至 点 8, 并 按 原 路 返回 , 这 条 路 上 有 三 个 交 
3 g 0.25 4750 0. 003 通 灯 . 设 天 是 卡车 在 去 送 货 点 如 的 路 上 遇 到 的 红 灯 
4 a 0 25 2 500 0.003 数 , 了 是 卡车 在 返回 送 货 点 4 的 路 上 遇 到 的 红 灯 





数 . 一 名 交通 工程 师 已 确定 了 不 和 了 的 联合 概率 分 
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布 , 如 表 中 所 示 . 








X=x 
0 1 2 3 
0 0.01 0.02 0.07 0.01 
Y=y 1 0.03 0.06 0.10 0.06 


2 0.05 0.12 0.15 0. 08 





3 0.02 0. 09 0. 08 0. 05 


a. 求 了 的 边缘 概率 分 布 . 
b. 已 知 卡车 在 去 送 货 点 已 的 路 上 遇 到 不 =2 个 红 
灯 , 求 了 的 概率 分 布 . 

.6 CPU 冷却 器 的 可 行 性 . 从 3 名 数据 处 理 经 理 、2 
名 高 级 系统 分 析 师 和 2 名 质量 控制 工程 师 中 随机 
挑选 出 3 人 组 成 一 个 委员 会 , 研究 在 咨询 公司 增加 
一 个 双核 CPU 冷却 器 的 可 行 性 . 设 存 表示 从 委员 
会 选 出 来 的 数据 处 理 经 理 人 数 , 了 表示 选 出 来 的 高 
级 系统 分 析 师 的 人 数 . 

a. 求 工 和 了 的 联合 概率 分 布 . 
b. 求 了 的 边缘 概率 分 布 . 

-7 人 脸 识别 技术 . 由 美国 国防 部 资助 的 人 脸 识 别 
技术 (FERET) 项 目的 设计 是 为 了 发 展 自动 人 脸 识 
别 能 力 以 保护 国家 的 安全 . 在 摄影 室 , 一 个 不 认识 
的 人 ( 称 观测 对 象 ) 的 生物 面部 “特征 ” 和 认识 的 人 
的 特征 作 比较 , 并 以 相似 得 分 作为 度量 . 人 脸 识别 
技术 包括 根据 相似 得 分 大 小 寻找 与 观测 对 象 特征 
相 匹 配 的 照相 算法 . 在 Chance(2004 年 冬 ), 用 离散 
的 Copula 概率 分 布 比较 算法 . 

设 X 表 示 观 测 对 象 用 算法 A 的 相似 得 分 , 了 表 
示 同 一 个 观测 对 象 用 算法 B 的 相似 得 分 . 假设 摄影 
室 有 编号 为 1.2 和 3 的 n=3 个 已 知 个 体 特征 . 用 


6.2 二 元 连续 随机 变量 的 概率 分 布 


X, X, FI X, 表示 算法 4 的 相似 得 分 , 7,Y Rn Y, 
表示 算法 B 的 相似 得 分 . 现 把 蕊 值 排序 并 定义 
Xo, E Xu, » Xo, > Xa. 类 似 地 ， 把 了 值 排序 
并 定义 Y, ,使 得 Ya, >Y. > Ya. 那么 ，Copula 
分 布 是 排序 后 的 和 了 的 联合 概率 分 布 , 给 出 
如 下 : 

MRE (X65, Yo, ) 在 样本 中 , p(x, y) = 
1/n, 如 果 不 在 , RETO, 其 中 x=1,2,3,…,n 是 
y-21,2,83,---,n. 

假定 对 n=3 时 的 某 个 观测 对 象 ， 其 相似 得 分 
(以 100 为 满分 ) 是 (Xi =75,Y, =60), (X, =30,Y, 
=80) 和 ( =15,Y, =5). 

a. 用 表 的 形式 给 出 这 个 观测 对 象 Copula 分 布 
p(x, y). 

b. 证 明 ; 如 果 在 特征 匹配 上 两 种 算法 完全 相同 ， 
则 有 p(1,1) =p(2,2) =p(3,3) =1⁄3. 


理论 练习 
6.8 ”两 个 离散 随机 变量 X 和 了 的 联合 概率 分 布 由 公 


式 给 出 : 2 
p(x,y) =p'*”q 67» 
其 中 x=0,1,0<p<1,9=1-p,y=0,1. 验证 它 满 


足 二 元 概率 分 布 的 人 性质 . 


6.9 设 革 和 了 是 两 个 离散 随机 变量 ， 其 联合 概率 分 


布 是 p(x, y). EX; 
Fi(a)=P(Xsa) 和 F,(a|y) - P(X&a | Y) 
证 明 以 下 各 式 : 


a. Fi(a) = V V p(u,y). 
Yo.) 


b. F,(a | y) TAG) 


如 我 们 在 第 4 章 和 第 5 章 所 学 ， 用 于 离散 随机 变量 的 定义 和 定理 也 适用 于 连续 随机 变量 .唯一 
不 同 的 是 离散 随机 变量 的 概率 是 求 和 ， 而 连续 随机 变量 的 概率 是 积分 . 在 这 一 章 我 们 将 定义 并 扩展 
离散 随机 变量 的 概念 ， 并 用 它们 去 证 明 关于 连续 随机 变量 等 价 的 定义 和 定理 

定义 6.4 两 个 连续 随机 变量 站 和 了 的 一 元 联合 概率 密度 函数 /(x,y) 是 满足 如 下 性 质 的 


Hh. 
l. 对 所 有 的 了 和 了 值 , f(x,y) >0. 


2. Ë Fro) = 1. 
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3. 对 所 有 的 常数 a,b,c 和 d, P(a < X < b,c < Y < d) = [ [yy asap. 

定义 6.5 ANa, y) Æ Xo Y &13X5- 3E RE VA C, 则 于 和 了 的 边缘 密度 函数 是 : 
AG) = Kad 和 hO) = [fonds 

定义 6.6 设 败 xy) 是 下 和 了 的 联合 密度 函数 ， 则 下 和 了 的 条 件 密度 函数 是 ; 


Kay) o La) 


假设 两 个 连续 随机 变量 和 和 了 的 联合 密度 函数 由 下 式 给 出 ; 
[e #0=x<1;0<y=1 
f(z,y) lo 其 他 
确定 常数 c 的 值 . 
解 f(x,y) 的 图 是 一 个 在 (x,y) 平 面 单位 正方 形 (0<x<1 且 0<y<1) 上 的 三 维 横 形 , 如 图 6.1 所 
示 . 选择 值 , 使 1x,y) 满 足 性 质 : fa.) 


[. [fe dxdy = 1 
求 这 个 积分 得 : 


f. [fen dxdy = f f erdixa 
= 中 ad = «f. z E 


1 1 











因此 ， 
f(x,y)-2x 对 0=x=1 和 0=y=1 
参考 例 6.4, 求 出 工 的 边缘 密度 函数 , 证 明 : 
[5o =i 
解 ” 由 定义 6.5， 
oo 1 
AG) = | frp) dy = 2 | zdy = 2x; 





y 
y=0 
因此 ， 


1 





œ 1 2 
[AGO = 2 | xd = 2( >) 
参考 例 6.4, 证 明 : Y 的 边缘 密度 函数 是 均匀 分 布 
解 了 的 边缘 密度 函数 由 下 式 给 出 : 
O) = [fenis = 2 | de = 2) |` 


0 


0 
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因此 , 户 (y) 是 定义 在 区 间 Os y 1 上 的 均匀 分 布 . 


参考 例 6.4 ~6. 6， 求 给 定 了 时 工 的 条 件 密度 函数 , 并 证 明 它 满足 性 质 : 
[AG bonds -1 
解 用 边缘 密度 函数 户 (7) =1( 例 6.6 sua 6.6, 我 们 得 到 条 件 密度 函数 如 下 : 


MERRER A (x | y) YE X 的 所 有 值 上 的 机 分 等 于 1: 


JAG |y)dx = »f xdx = x2) |. 


x, Ozxxl 


1 
zi 





LEN it X H Y WK AME: 
[ex #r0=sx=y;0=y=1 
feno 其 他 
R c 的 值 . 


解 参考 图 6.1， 如 果 我 们 通过 槐 形 的 平面 ，(0,0) 
和 (1,1) 两 点 的 对 角 线 , BETO, FEHER, 再 党 
E y 轴 的 一 段 就 会 有 一 个 类 似 于 所 给 密度 函数 的 形状 ( 见 
图 6. 2). c 值 会 大 于 例 6.4 中 所 求 的 值 , 因为 图 6. 2 所 示 





的 立体 的 体积 必须 等 于 1. 


通过 在 由 0<x<1 和 0<y<1 定义 的 三 角 区 域 (如 图 
令 这 个 积分 等 于 1, RH c: 


6.3 所 示 ) 上 积分 f(x ,y) , 
[. [ fs) drdy = f. J erroy =c ! 23 


E 





0 





J(x,y) = 6x. 

对 多 于 两 个 随机 变量 , 如 了 ,Y, ,…， 
数 , 用 符号 f(y1 ,72 ,… 
函数 用 与 二 元 情况 类 似 的 方法 定义 . 


应 用 练习 
6.10 RNDR. 运输 部 监控 新 路 修建 的 密封 投 
标 . 对 某 一 州 的 新 通道 路 , W X - IK f (T 
元 ) , 设 Y= 运 输 部 估计 的 修建 道路 的 合理 成 本 ( 千 
美元 ). 志和 了 的 联合 概率 密度 是 
Kay) = 所 7 ， 
a. 求 了 的 边缘 密度 函数 7 y), 你 能 认 出 这 个 分 
布 吗 ? 


O<y<x<2y 


dy 

£ 
o 6 
STERFT, 并 解 出 c = 6; 因此 在 关注 的 区 域 上 


Y, 的 联合 密度 函 
Yn) 表示 . 边缘 密度 函数 和 条 件 密度 


xX=y 


图 6.2 fJ 6.8 的 联合 密度 函数 图 








图 6.3 例 6.8 的 积分 域 


b. 求 运输 部 估计 的 期 望 (了 Y) 是 多 少 ? 


6.11 影印 机 的 摩擦 力 . 参考 练习 5. 8 ( International 


Journal of Robotics Reath,1993 年 5 H ) 关于 纸张 分 
离 摩 擦 力 的 研究 . 考虑 一 个 利用 两 个 相互 联系 着 的 
供 纸 分 离 系统 . 两 台 机 器 的 摩 氛 系 数 式 和 了 的 联合 
密度 , 由 下 式 给 出 


xy # 0=<x<1;0=y=<1 

(2-x)y # l=x=2;0=y=1 
f(x,y) = ka 

x(2 - y) #0=x<l;1=y=2 


(2 -x)(2-y) 车 1<x<2;1<y<2 
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a. 验证 所 x,y) 是 二 元 联合 概率 分 布 函数 . (说 明定 
X6. 4 XJ f(x ,y) Rr. ) 
b. 求 两 个 摩擦 系数 都 超过 0. 8 的 概率 . 
6.12 汽车 服务 . 设计 为 一 辆 汽车 到 达 服 务 队列 和 
服务 后 离开 该 系统 之 间 的 总 时 间 (min) , Y 为 该 车 
服务 前 在 队列 中 等 待 的 时 间 (min) , 了 和 了 的 联合 


密度 为 : 
Kay) = 位 Aa ome oo 


a. 求 使 (x,y) 成 为 概率 密度 函数 的 < (8. 
b. 求 X 的 边缘 密度 , MER: 
f A G0ds -1 
c. 证明 ; 给 定 X 时 ,了 的 条 件 密度 是 区 间 0<Y<X 
上 的 均匀 分 布 . 
(9) 理论 练习 
6.13 设 了 和 了 有 联合 密度 ; 
x+cy 若 1<x<2;0<y<1 
fos = | tom , 


0 其 他 
其 中 。 是 常数 . 
a. Roet, 使 (x,y) 成 为 概率 密度 函数 . 
b. 求 了 的 边缘 密度 , 并 证 明 : 


[AOW =1 


c. RAE Y Ib, X UREE f. (x | y). 
6.14 设 民 和 了 有 联合 密度 ， 


6.3 两 个 随机 变量 的 函数 的 期 望 值 


cay #O=<x<1;0=<y=1 
fe) = {0 
a. 求 c 值 , 使 A(x,y) 成 为 概率 密度 函数 . 
b. 求 边缘 密度 f(x) 和 f(y). 
c. 求 条 件 密度 f(x | y) fü Cy | z). 
6.15 设 X 和 了 是 两 个 连续 随机 变量 , 联合 概率 密 
BEN. 
ce tt) # Oxx«o0zyzo 
re) = 其 他 
OR c MB. 
RA (x). 
. 求 户 (7). 
. RA | y). 
e. OR f Cy | x). 
f. 求 P(X&1,Y«1). 
.16 设 XY 和 了 是 两 个 连续 随机 变量 , 联合 概率 密 
BEN f(x y). 联合 分 布 函数 为 F(a,b) & WT: 


£ p tc p> 


o 


F(a,b) = P(Xxa,Y xb) = f. [ro dis 


证 明 以 下 各 式 : 
a F(-o,—-o)-F( -ow,y) -F(x,- 0) =0. 
b. F(o ,o) =1. 
c aa H b, zb, , M 
F(a,,b,) -F(a ,b,) 2 F(a,,b) - F(a,,bj) 


用 于 推断 的 统计 量 是 由 样本 中 的 数据 计算 得 到 的 样本 测量 值 可 以 看 作 是 n AAE Y, Y, Y, 
的 观测 值 , 其 中 Y, 表示 样本 中 的 第 一 个 测量 值 , Y 表示 第 二 个 测量 值 等 等 . 由 于 样本 统计 量 是 随机 
ER Yi, Yoe, Yn 的 函数 ， 因 此 它们 也 是 随机 变量 , 并 有 概率 分 布 . 为 描述 这 些 分 布 , 我们 将 定义 两 
个 或 多 个 随机 变量 函数 的 期 望 值 (或 均值 ), 并 给 出 三 个 相应 于 第 5 章 给 出 的 期 望 定理 . 定义 和 定理 
将 在 二 元 范围 中 给 出 , 但 通过 代入 相应 的 多 元 函数 和 记号 ,都 可 以 写成 关于 任意 个 随机 变量 的 一 般 
ER. 
定义 6.7 ik z(X,Y) £ M UE S Xo Y Wii. 则 eX ARAE 305. 
> Y's(x,y)p(x,y) # X # Y E Br B WO 
E[e(X,)] - 1 ” 7 
fa [aED y) dedy E xm Y 365800 


假设 e CX, 了) 仅 是 一 个 随机 变量 ( 如) 的 函数 ， 我 们 将 证 明 在 离散 情况 下 , 这 个 函数 的 期 望 值 
有 与 第 5 章 相同 的 意义 . 设 g(X,Z) 仅 是 下 的 函数 ， 即 5(X,7) =g(X)， 那么 
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E(g(X)] = Y Ye(x)p(x,y) 
先 对 了 求 和 (这 种 情况 碟 视 为 常数 , 可 以 作为 因子 放 在 求 和 符号 外 ) , 我 们 得 : 
Elg(X)] = X g(x) X p(x,y) 


然而 , 由 定义 6.2，2, p(x,y) 是 瑟 的 边缘 概率 分 布 . 因此 ， 


E[g(X)] = È eC)p1 (a) 
可 以 验证 这 与 定义 4. 5 中 给 出 的 E[g(X) ] 具 有 相同 的 表达 式 . 若 半 和 了 是 连续 随机 变量 ,一 个 类 似 
的 结论 成 立 ( 证 明 略 ). 从 而 , A C ,2) 和 (jw,,02) 分 别 表示 针 和 了 Y 的 均值 和 方差 , 那么 对 x 或 y 的 
函数 的 二 元 期 望 应 等 于 第 5 章 给 出 的 相应 的 期 望 , 即 E(X) =u, ELC -1)?] =o 等 . 
可 以 证 明 ( 证 明 略 ) 第 5 章 的 三 个 期 望 定理 对 二 元 变量 成 立 , 并 且 一 般 情况 下 , 对 多 元 概率 分 布 
也 成 立 . 我 们 将 在 6.5 节 和 6.6 节 应 用 这 些 定理 . 
定理 6.1 设 c 是 一 个 常数 , WJ c 的 期 望 值 是 : 
E(c) =c 
定理 6.2 设 c 是 一 个 常数 , Rike(X,Y)Z Bi pud S X do Y 89, W cg (X, Y) 69337848 X. ; 
El cg( X, Y) ] x cE[ g(X,Y)] 
定理 6.3 tg (X,Y), ga(X,Y), e, gu (X, Y) 是 随机 变量 政和 了 的 上 个 函数 , 则 这 些 函 数 和 
的 期 望 值 是 : 
Elgy OGY) eg; (X,Y) € 8g (X,Y)] =Elg (X,Y)] +Elg (X,Y)] +- +E[ g, (X,Y)] 


© 应 用 练习 : A ER. 
> y 
6.17 自动 钴 孔 机 ， 参考 练习 6. 3. 
a REX). c. R E(X +Y). 
b. 3k E(Y). d. 3R E( XY). 
6.18 卡车 道上 的 红 灯 . 参考 练习 6 .了 6. 21 Ned 6.15. 
^ 平均 来 说 , EARRA B WEE, REMES ° A EY 
到 多 少 个 红 灯 ， BI E( X) Sp? EH un 
?在 整个 路 线 上 过 到 的 红 灯 的 总 数 (也 就 是 说 , MM ). 
点 也 再 返回 点 4) 是 下 + 了 oR E(X +Y). UN Qm. . 
619 RAE EOD 6 lO 6.22 设 X 和 了 是 两 个 连续 随机 变量 , 其 联合 概率 
a RBC I). 分 布 为 (x, y). 考虑 函数 z( X). 证 明 ， 
b. R EGY). ELg(X)] = | zGOf G)ds 
理论 练习 6.23 ”对 离散 随机 变量 站 和 了 了, 证 明定 理 6. 1 - 6.3. 
6.20 参考 练习 6. 13. 6.24 对 连续 随机 变量 了 和 Y, 证 明定 理 6. 1 ~ 6.3. 
6.4 独立 性 


在 第 3 章 已 经 学 过 , 若 P(4mB) =P(A)P(B) , 则 两 个 事件 4 和 8B 称 作 独 立 的 . 由 于 两 个 离散 随 
机 变量 X 和 Y 了 所 取 的 值 表示 两 个 数值 事件 , 所 以 它 也 有 如 果 p(x,y) =p (x) p (y) , FE X A Y ith 
立 的 . 两 个 连续 随机 变量 , 如 果 它 们 满足 类 似 的 准则 , 也 称 作 独 立 的 . 
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定义 6.8 设 X 和 了 Y 是 离散 随机 变量 , 其 联合 概率 分 布 为 p(x,y), 边缘 分 布 分 别 为 p1 (x) 和 
px (y). M) X fo Y 44h vr BU 55 Edo 
p(x,y) 2» pyCx) pa Cy) 对 每 一 对 x de y 的 值 
定义 6.9 设 和 了 是 连续 随机 变量 , 其 联合 密度 函数 为 /(x,y) ,边缘 密度 函数 分 别 为 三 (zx) 
fe f; (y). 则 互 和 了 称 作 独立 的 当 且 仅 当 
J(x,y) =A G0 (y) 对 每 一 对 x de y 的 值 
参考 例 6.4, 确定 XY 和 了 是 否 独立 . 
解 ” 由 例 6.4 一 6.6, 我 们 有 以 下 结论 : 
S(x,y) =2x fi(x)=2x f(y)=1 
因此 ， 
AG) (y) =(2x)(1) 22x =f(zx,y) 
由 定义 6.9, XA Y Jécfh vr BOBESLAE E. 
参考 例 6. 8, 确定 X 和 了 是 否 独立 . 
解 ” 由 例 6.8, 我 们 求 得 当 0<x<y 且 0<ys<1 时 , 有 f(x,y) =6x. 
因此 ， 


= 6x(1 — x) 





oo 1 1 
AG) = | /Gz,y)ay = | 6xày = 6zy 
Rrih0<x=1, 类 似 地 ， 
° 2 
BO) = | fr) dr = fade = E , = 3y 
Rp osya. DW fi (x)f,(y) 218x(1 23)? RAT f(x, y). 因此 ,政和 Y 不 是 独立 的 随机 变量 . 
定理 6.4 给 出 独立 性 的 一 个 有 用 结论 . 
定理 6.4 车站 和 了 是 独立 的 随机 变量 ， 则 
E(XY) =E(X)E(Y) 
定理 6. 4 的 证 明 ”我 们 将 对 离散 的 情况 证 明 该 定理 . 对 连续 的 情况 ， 除了 用 积分 代替 求 和 , 其 
证 明 是 相同 的 . 由 期 望 值 的 定义 , 我 们 有 
E(XY) = Y «yp(x,y) 
但 是 , 由 于 XX 和 了 是 独立 的 , 可 以 写成 p(x, y) =p (pO). 因此 ， 
E(XY) = > È «pi Gp (y) 


AUR ADU. ARM, 我 们 可 以 把 Y 和 pa(7) 看 作 常数 ， 并 应 用 定理 6.2 把 它们 作为 因子 从 和 号 中 如 下 
分 解 出 来 : 


2 





E(XY) = X yp2 (y) 》 xpi (x) 
s. 7 7 
Mop (z) = E(x) Fl Y yp (y) - E(y) 
因此 ， l | 
E(XY) = E(X) E(Y) 
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应 用 练习 6. 30 元 件 寿命 设 蕊 和 了 表示 一 个 电子 系统 中 两 
6.25 IF-THEN 软件 代码 .参考 练习 6.1. 和 和 了 是 a aiá ki k 

独立 的 吗 ? 


6.26 WET. 参考 练习 6.2. 在 和 了 是 独立 的 吗 ? 
6.27 自动 钻 孔 机 .参考 练习 6.3. 和 和 了 是 独立 


的 吗 ? 
6.28 机 器 人 传感器 系统 配置 . 参考 练习 6.4. X FLY 
是 独立 的 吗 ? 


6.29 保险 丝 的 寿命 . 用 于 计算 机 接线 柱 上 的 保险 丝 
寿命 Y 百 小 时 ) 服从 指数 分 布 , 均值 B=5. 每 个 接 
线 柱 要 求 两 个 这 样 的 保险 丝 一 一 一 个 充当 备用 件 ， 
仅 当 第 一 个 保险 丝 失 效 时 投入 使 用 . 

a 如果 两 根 这 样 的 保险 丝 有 独立 的 寿命 X 和 了 ， 
求 联合 密度 f(x,y). 

b. 这 两 根 保险 丝 总 的 有 效 寿命 是 (+Y). RAE 
计算 机 接线 柱 上 的 一 对 保险 丝 总 的 有 效 寿 命 的 
3m. 


6.5 两 个 随机 变量 的 协 方差 和 相关 性 


fis) = [r7 apa 
0 其 他 
证 明和 了 是 独立 的 . 【提示 : 多 元 概率 理论 中 的 
一 个 定理 是 X 和 YY 是 独立 的 , 如 果 我 们 有 
f(x,y) =g(x)h(y) 
其 中 g(x) 只 是 x WIER RRE h( y) RÆ y 的 非 负 
函数 . ] 
6.31 影印 机 摩擦 力 ， 参考 练习 6.11. WEH X MY 
是 独立 的 .【 用 练习 6. 30 的 提示 . ] 
理论 练习 
6. 32 ”参考 练习 6.13. XA Y Ji vr fn? 
6.33 ”参考 练习 6. 14. XX 和 了 是 独立 的 吗 ? 
6.34 ”对 连续 的 情况 证 明定 理 6. 4. 


当 认 为 两 个 随机 变量 XX 和 Y 有 关系 时 , 我 们 通常 设想 这 样 一 种 关系 , 随 X 增 大 了 也 增 大 或 随 X 


增 大 了 减 小 . 换 句 话说 , 我 们 倾向 于 认为 线性 关系 . 


如 果 互 和 了 是 随机 变量 , 我 们 收集 了 一 个 有 n 对 (x,y) 值 的 样本 , 画 出 的 数据 点 不 可 能 准确 地 落 
到 一 条 直线 上 . 如 果 这 些 点 位 于 离 直线 很 近 的 地 方 , 如 图 6. 4a 和 6. 4b 所 示 , 我 们 就 认为 X 和 了 Y 间 的 
线性 关系 很 强 . 如 果 它 们 散布 得 不 像 一 条 直线 ,如 图 6. 4c 和 图 6. 4d 所 示 , 我 们 就 认为 线性 关系 是 弱 
BJ. (注意 ,图 6.4d 中 所 示 的 和 了 之 间 的 关系 依 曲线 关系 是 很 强 的 . ) 如 何 度量 两 个 随机 变量 XX 和 


了 之 间 线 性 关系 强度 呢 ? 


Y Y 
| 








——X = X 











=X | i : X 





a) 强 的 正 关系 b) 强 的 负 关系 





c) 弱 关 系 d) 弱 线性 关系 ( 强 非 线性 关系 ) 


图 6.4 天 和 了 之 间 的 线性 关系 


度量 线性 关系 强度 的 一 种 方法 是 计算 每 一 个 数据 点 的 离 差 叉 积 (% -jw ) (y -wy )， 当 数据 点 在 图 
6.5 中 的 右上 或 左下 象限 时 , 这 些 叉 积 是 正 的 ; 当 点 在 左上 或 右 下 象限 时 , 这 些 又 积 是 负 的 . 如 果 所 有 
点 位 于 直线 附近 并 有 正 斜 率 , 如 图 6. 4a 所 示 , 几乎 所 有 的 叉 积 (x -Au )(y - n, ) 是 正 的 , 它们 的 平均 值 
相对 大 且 是 正 的 . 类 似 地 ,如果 所 有 点 位 于 直线 附近 并 有 负 和 斜率 , 如 图 6. 4b MR, (x - B.) (y -u ) 
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的 平均 值 将 是 相对 较 大 的 一 个 负数 . 然而 , RUR X I Y y 
线性 关系 相对 地 弱 , 如 图 6. 4c 所 示 , 点 将 落 到 所 有 的 四 个 象 1 
RP, 一 些 叉 积 (x -jw) (yu) ER, 一 些 是 负 的 , 并 且 
它们 的 均值 相对 小 一 一 可 能 非常 接近 于 0. 这 就 引出 下 面 度 
量 两 个 随机 变量 之 间 线 性 关系 强度 的 定义 . 

定义 6. 10 ”两 个 随机 变量 夺 和 了 的 协 方差 ,定义 为 ， 

Cov(X,Y) =E[ (X -u,) (Y -4,)] 
定理 6.5 Cov(X,Y) =E(XY) -Hylly 
定理 6. 5 的 证 明 由 定义 6.10, 我 们 可 以 记 
Cov( X,Y) =E[ (X -u,)(Y-p,)] 图 6.5 叉 积 (x u.) (y -局 ) 的 符号 














L— = X 





-E(XY -uY -u X +u) 
应 用 定理 6.1、 定理 6. 2 和 定理 6.3 得 ， 
Cov(X,Y) =E(XY) -—z,E(Y) 一 A E( X) tk, = E( XY) - nau, - hay + an, 
-E(XY) - uu, 
求 例 6. 4 中 随机 变量 X 和 了 的 协 方差 . 
解 当 0<xs1 且 0<y<1 时 , 变量 有 联合 密度 函数 f(x,y) =2x， 则 
2 


E(XY) = J Í C9) 2rdrdy = f (2) |y = 了 | yay = Z) 





在 例 6. 5 和 例 6. 6 中 , 我 们 得 到 边缘 密度 函数 fi (x) =2x Ff; (y) 21. 因此 ， 





se Q0 = [renis = iso | - 


进一步 , 由 于 了 是 定义 在 区 间 0<y<1 上 的 均匀 随机 变量 ( 见 例 6.6). Hi 5. 4 节 , n, -1/2. Wi 


Cov( X,Y) = E(XY) - uj, =+- BE =0 


例 6. 11 说 明了 一 个 重要 的 结论 : AUR. X A Y EIR, 那么 它们 的 协 方差 等 于 0. 然而 , 反 过 来 


往往 不 成 立 G. 
定理 6. 6 如 果 两 个 随机 变量 于 和 了 是 独立 的 ,那么 
Cov(X,Y) =0 
定理 6.6 的 证 明 很 容易 由 定理 6. 5 得 出 , 留 作 选 做 的 练习 . 


如 果 两 个 随机 变量 的 协 方差 是 正 的 , 那么 外 增 大 时 了 趋向 于 增 大 . 如 果 协 方差 是 负 的 , SEA X 
增 大 时 了 趋向 于 减 小 . 但 是 对 协 方差 的 数值 我 们 该 怎么 理解 ? 我 们 知道 协 方差 等 于 0 意味 着 不 和 了 
之 间 没 有 线性 关系 , 但 是 当 协 方差 非 0 时, 它 的 绝对 值 将 依赖 于 下 和 了 的 度量 单位 , 为 克服 这 个 困 


XE, 我 们 定义 协 方差 的 一 个 标准 形式 , 称 作 相关 系数 . 





O 可 以 证 明 ( 证 明 略 ) 如 果 和 了 是 联合 正 态 分 布 , 反之 亦 真 . 


»X 
° 
起 





182 

定义 6. 11 对 两 个 随机 变量 上 和 了 ,相关 系数 p 是 : 
_ Cov( X, Y) 
T 0,0, 


其 中 =, foo, DAIR X e Y 6 482 2. 


HUT p 等 于 协 方差 除 以 两 个 正 数 o, 和 cy 的 乘积 , 所 以 它 和 协 方差 有 相同 的 符号 . 另外 , 它 总 是 
《证 明 略 ) 在 区 间 -1<p<1 上 取 和 值 . p= -1 和 p=1!1 表 明 世 和 了 间 是 完美 的 直线 关系 , 前 者 斜率 是 负 
的 , 后 者 斜率 是 正 的 . p =0 表明 无 和 了 间 没 有 线性 关系 . 








相关 系数 的 性 质 


-Ixpxl 








应 用 练习 

6. 35 IF-THEN 软件 代码 . 求 练习 6. 1 中 随机 变量 X 
和 了 的 协 方差. 

6.36 HRF. 求 练习 6.2 中 随机 变量 天 和 了 的 协 
方差 . 

6.37 自动 钻 孔 机 . 求 练习 6.3 P. XL Y HAE E 
数 p. 

6.38 卡车 道上 的 红 灯 . 参考 练习 6.5. 

a. 求 随 机 变量 了 和 了 的 协 方差 . 
b. SR X ftl Y 482: ZG p. 

6.39 油箱 容量 . 商用 煤油 在 每 周 初 总 是 储存 在 大 油 
箱 内 , 由 于 限量 供给 , 每 周 内 可 销售 部 分 不 和 实际 
销售 部 分 了 对 油箱 容量 的 比 是 连续 随机 变量 . 它们 
的 联合 分 布 由 下 式 给 出 : 


[44 #0O0=y=x;0=x=1 
fao)= 其 他 
求 式 和 了 了 的 协 方差 . 
(9) 理论 练习 


6.40 参考 练习 6.13. 


'6.6 随机 变量 函数 的 概率 分 布 和 期 望 值 


a. 求 随机 变量 不 和 了 了 的 协 方差 . 
b. SK X A Y HHRH p. 
6.41 参考 练习 6. 14. 
a. 求 随 机 变量 和 了 的 协 方差 . 
b. K X A Y KHR RX p. 
6.42 ”对 离散 情况 , 证 明定 理 6. 6. 
6.43 ”对 连续 情况 , 证 明定 理 6. 6. 
6.44 REY 6.15 中 的 随机 变量 和 了 的 协 方差 . 
6.45 ”作为 一 个 为 什么 定理 6.6 的 道 不 成 立 的 例证 ， 
考虑 由 下 表 给 出 的 两 个 离散 随机 变量 X 和 了 的 联 
合 分 布 . 证 明 : Cov( X, Y) =0, 但 是 了 和 了 Y 是 相 
关 的 . 














X=x 

-1 0 +1 

-1 1 2 1 

12 12 12 

2 2 

Y=y 0 12 0 > 
+1 T 2. i. 

12 12 12 





在 前 面 三 节 中 , 我 们 考虑 了 两 个 随机 变量 的 函数 . 本 节 将 考虑 更 一 般 的 情况 , 即 一 个 或 多 个 随 


机 变量 的 函数 . 


求 随机 变量 函数 的 密度 函数 , 实质 上 有 三 种 方法 , 其 中 的 两 种 (和 矩 母 函数 法 和 变换 法 ) 超 出 了 本 
书 的 范围 , 但 是 在 本 章 最 后 参考 书目 中 可 以 找到 关于 它们 的 讨论 . 第 三 种 方法 , 我 们 称 作 累 积分 布 


函数 法 ,将 用 例子 说 明 . 


假设 WW 是 一 个 或 多 个 随机 变量 的 函数 ,累计 分 布 函数 法 是 通过 先 求 概率 P(W<w), CEF 
F(w) 来 求 下 的 密度 函数 . 然后 对 F(u) T woR S, 得 到 密度 函数 /(w). 我 们 将 在 例 6. 12 和 例 


6.13 中 来 说 明 这 种 方法 . 
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假定 随机 变量 了 有 指数 密度 函数 
/B 
JOo)= 1 B 


并 设 W = 2, 求 随机 变量 多 的 密度 函数 

解 丈 = 玉 的 图 形 如 图 6.6 中 所 示 , RINE 到 和 了 的 累积 分 布 函 数 分 别 为 CCo) FO). 从 图 
中 我 们 注意 到 只 要 了 比 y 小 , 多 就 比 w 小 ; 得 到 P(W<u) = 
C(w) =F(y). BT W-Y , RIH y - wf 














Jw Vw e-Y/B 
FQ) = Fw) = [ayay = f $778; 
"— os n 21-e-Qwg) 
0 
因此 , 多 的 累积 分 布 函数 是 : 
G(w) 21-e- Gp 
求 导 可 得 W HEERA: 
-1/2, - (V/w/g) 
| e ego) TET. 
LEER 如 果 随机 变量 XY 和 YY 有 单位 正方 形 上 的 均匀 联合 密度 函数 ,那么 对 0<x<1 和 0<y<1 
有 f(x,y) =1. 求 W 2 X + Y UB S BE RR y 


解 WW 的 每 个 什 相 应 于 直线 w=*+y 上 的 一 系列 点 ( 见 图 6.7)， | 
写成 斜率 - 截 中 形式, y=w -<, 这 是 侠 率 等 于 -1 B y BES uH, 
直线 方程 小 于 或 等 于 v 的 玉 值 是 相应 于 直线 w=*+y 下 面 的 那些 
O (DARS. T 的 阴影 区 域 ) WAI y RE w 的 值 0<w<1, Wh 
于 或 等 于 u 的 概率 等 于 图 中 所 示 阴 影 区 域 的 几何 体 的 体积 , 我 们 可 以 
通过 多 重 积分 求 这 个 概率 ,但 借助 几何 学 更 容易 求 得 .三 角形 相等 的 。 | p 
两 边 中 每 一 边 的 长 度 都 是 w 因此 ,阴影 三 角 区 域 的 面积 是 w2/2. 几何 _ 
体 在 区 域 上 的 高 度 是 f(x,y) =1, 体积 是 en 
P(Wzw)-G(w)-w?72 (0<w<1) 


在 区 间 1<w<2 上 G(w) 的 等 式 是 不 同 的 . P(W<w) = G(w) 的 
概率 是 fx,y) =1 在 图 6.8 所 示 的 阴影 区 域 的 积分 , 这 个 积分 可 由 1 
减 去 位 于 直线 w =x +y 上 方 的 小 三 角形 ( 非 阴影 ) 的 体积 求 得 . 为 求 三 
角形 一 边 的 长 度 , 我 们 需要 确定 直线 w = x +y 和 直线 y = 1 交点 的 位 
E. 把 y=1 代入 到 直线 方程 ,我 们 求 得 

w=x+1 或 x=u-1 
点 (w ~1,1) 标 在 图 6.8 中 ， 三 角形 相等 的 两 边 每 一 边 长 度 都 


是 f=1-(w-1)=2-w. 位 于 直线 w=x+y 上 方 的 三 角形 的 面 图 和 8 显示 求 C(w) 的 积分 
积 是 : KRA ,1 <w<2 
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1 d | (2-w)? 
面积 = 地 ( 底 )( 高 ) => (2-0) (2-w) =t 


由 于 在 三 角形 上 面 的 几何 体高 度 是 帮 x,y) 21, W BET Ei wx ey 上 方 的 概率 是 (2-w)?/2. 从 1 
中 减 去 这 个 概率 , 我 们 求 得 WW 位 于 直线 下 方 的 概率 是 : 
_4-4w +w? _ 


2 
Go) =1 2 z-142w-wl/2 (1xwx2) 


现在 由 对 G(w) 求 导 得 到 两 个 随机 变量 人 和 YY 的 密度 函数 : 





G(w) =P(Wsw)=1- 








2 
g(w) = = =w (Üzwzl) 
_ — an? 
g(w) 3669). _ d( 1 +2w -w*/2) -2-w (1<w<2) 
dw dw 


WW=X+Y 的 累积 分 布 函 数 图 和 密度 函数 图 分 别 由 图 6. 9a 和 6. 9b 给 出 . 注意 , 区 间 0<w<2 上 密度 
函数 下 方 的 面积 等 于 1. 





G(w) g(w) 
E 10 
esr 0.5 
0 1 7” 0 1 27" 
a) 累积 分 布 函 数 图 b) 密度 函数 图 


图 6.9 ”下 = 了 + 了 的 累积 分 布 函数 和 密度 函数 图 


单个 连续 随机 变量 的 最 有 用 函数 之 一 是 累积 分 布 函数 本 身 . 我 们 将 证 明 如 果 Y 是 连续 的 随机 变 
E, 密度 函数 为 /(y) ， 累 积分 布 函数 为 F(y) , 那么 WW=F(Y) 有 区 间 0<w<1 上 的 均匀 概率 分 布 . 利用 
产生 随机 数 的 计算 机 程序 , 我 们 可 以 产生 一 个 球 值 的 随机 样本 . 对 于 的 每 个 值 , 我 们 可 由 方程 W = 
F(Y) 求 出 相应 的 Y 值 , 因此 , 由 密度 函数 f(y) 的 总 体 得 到 Y 了 值 w 
的 随机 样本 . 我 们 把 这 个 重要 变换 当 作 定 理 给 出 , 证 明 它 , 然后 jo 
用 一 个 例子 来 说 明 它 的 用 法 

定理 6.7 设 了 是 一 个 连续 随机 变量 , 密度 函数 为 f(y)， 
累积 分 布 为 F(Y). 那么 W-F(Y)u 8 E V 6 ARE SLE DU 
0 xwzl 上 的 均匀 分 布 ， 即 

-g(w) -1 (0<w1) 

定理 6.7 的 证 明 图 6.10 是 W=F(Y) 的 示意 图 ; 了 是 连 o 

续 随 机 变量 , 从 图 中 可 以 看 出 y 值 和 w 值 之 间 有 一 个 一 一 对 应 





1 
1 
I 
1 
i 
I 
I 
I 
I 
1 
! 
y 


图 6. 10 累积 分 布 函数 F( y) 
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关系 ,对 应 于 区 间 0<W<w F WK Y (Ede EDX IB] 0< Y<y 上 的 值 . 因此 ， 
. P(W=u) =P(Y=y) = F(y) 
HHI W = F(Y), TE FO) =w. 因此 我 们 可 以 写成 : 
G(w) -P(Wzw) =F(y) =u 
最 后 ， 我 们 在 范围 0<w<1 上 求 导 获得 密度 函数 : 
gw) = = 


用 定理 6.7 产生 一 个 来 自 B=2 的 指数 分 布 的 n=3 个 观测 值 随机 样本 . 
解 B=2 的 指数 分 布 的 密度 函数 是 : 


1 (Oxwxl) 


e 7? 
fo) -| 2 
0 其 他 


# 0=y < = 


累积 分 布 函数 是 ; 





' e y 
FQ) = f Ade = [y = Scd ce? 


An TE W=F(Y) =1 -eC , 那么 定理 6.7 告诉 我 们 ,到 有 区 间 0 < W < 1 上 的 均匀 密度 
PRAEC 

为 抽取 一 个 指数 分 布 的 随机 数 了 ， 先 从 均匀 分 布 随机 取出 一 个 W fi. 这 可 从 表 B. 1 或 利用 计算 
机 得 到 一 个 随机 数 . 例如 , 假设 我 们 取出 随机 数 10480. 这 相应 于 从 区 间 0<W<1 上 的 均匀 分 布 随机 
选取 值 W, =0. 10480. 把 W, 的 值 代入 到 公式 W = F(Y) 并 求 Y, 我 们 得 

=F(Y) =1-e-Y? 
0.10480 21-e- ^7 
e ^? 20, 8952 


5 0. 111 
2 7^ 


=0. 222 

如 果 选 取 的 下 两 个 随机 数 是 22 368 和 24 130, 那么 均匀 随机 变量 相应 值 是 W, = 0.223 68 和 W; = 
0.24130. 把 这 些 值 代入 公式 W=1 -e Y2, 可 以 验证 Y=0.506 和 5 =0.552， 从 而 Y, «0.222, 
Y, =0. 506 和 Y, =0. 552 表示 随机 选取 的 均值 等 于 2 的 指数 随机 变量 的 三 个 观测 值 . 

下 面 我 们 来 讨论 一 个 非常 有 用 的 随机 变量 函数 一 一 线性 函数 . 

定义 6.12 iR Y,,Y;,--,Y, 是 随机 变量 , 并 设 ol ,a)，…,a 是 常数 . 那么 [是 Y; ,克也 的 
一 个 线性 函数 ， 如 果 

t€=a Yi +a,Y, * +a, Y, 
Yi, Y), c, Y, 线性 函数 的 期 望 值 (均值 ) 和 方差 ,可 以 用 定理 6.8 给 出 的 公式 计算 得 到 . 
定理 6.8 yy …, 了 的 线性 函数 的 期 望 值 EC(《) 和 方差 V(6) 9 BEY, Y, Y, 的 均值 








O 在 前 几 节 , 我 们 对 符号 o 用 了 不 同 的 下 标 来 表示 不 同 随机 变量 的 方差 . 如 果 这 个 随机 变量 是 若干 个 其 他 随机 变量 的 
函数 ,记号 就 会 很 繁琐 . 因此 , 我 们 将 交替 用 记号 o1, 或 V( ) 表 示 方 差 . 
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TIE 284) SIE (ua 01) , (45,02) n, (us uL). WE £a] Y, tay + +a,Y,, 那么 
 E(£) =a t ap * - +a, 
和 


o zy(£) -alg? + aso Le ta?g? *2a41a5Cov( y, ,ya ) *2a4a4Cov(yp,y4) + 


*2a,a,Cov( y, ,y,) *2a5a4Cov( yo ,y4) 十 … 
*2a5a, Cov( y? ,y,) +… *2a, 41a,Cov(y, 1,4) 
E: 如 果 Y, Y, s Y, 是 独立 的 ,那么 
o? 2V(£) alo] *algl4-- *alg? 
定理 6. 8 的 证 明 由 定理 6.3 知 ， 
E(£ )  E(a, Yi) +E(a,Y,) ++- +E(a,Y,) 
那么 , 由 定理 6. 2 0, 
E(£ ) =a E(Y,) *a5E(Y,) + +a, E(Y,) =G, 44 5345 t +G, 
类 似 地 ， 
VW(€) 2 El[C- E(£)]?] 
7 E[ (a, Y,  a5Y; ++ +a, Y, - a44 一 az — 7: — a,4,)? ] 
=E|[a (Y; -u,) +a (Y; -p5) ++ +a (Yn -Hn) ]2] 
=E[a1(Yí -m )? +a2( Y, - 5)? ++ + aZ (Y, - p, )? 
+2ajaz(Y; - 4 ) (Y, 75) *2a4a5(Y, -m ) (Y, -pa) 
*t2a, G ,(Y, 4 75, 4)(Y, -pn)] 
=atE[ (Y, 74)? ] + +akE[ (Y, -pa)?] 
*2aya5E[ (Y, - 1) (Y) 245) ] *2aqa4 E[ (Y, ^4 ) (Y 73) ] 
t= +2a,- ia E| (Y, 1 78, 4)(Y, -pn)] 
由 方差 和 协 方差 的 定义 , RIA: 
E[(Y;-u)?]-o? 和 EL (Y, -u;) (Y; -uj) ] = Cov(Y,,Y;) 
因此 ， 


V(£) 2oloi-*olo$-4-- +a2o2 *2a4a4Cov( Y; , Y2) +2arasCov( Y, ,Y4) 
+- +2a,asCov( Y; ,Y4) + +2G, 41a,Cov(Y, _, , Y, ) 


DNES Ern 入 是 随机 变量 , B Qa 21,02 22), (ua 23,03 2D , (us 20,02 =4), 
Cov( Y; , Y) = - 1, Cov(Y, ,Y4) -2 和 Cov( Y;j,Y4) 21, 求 下 式 的 均值 和 方差 
£ z2Y, +Y, -3Y, 
解 ”线性 函数 
£ 2Y, +Y, -3Y, 
有 系数 a, 22,2, =1, 和 a3 = -3. 所 以 由 定理 6.6 知 ， 
He = ECC) = ay tay t asus = (2) (1) +(1)(3) +( -3)(0) =5 
o -VW£ ) =o} * a202 + abo} *2a,a5Cov( y; , y) * 2a4a4Cov( y, ,y4) 
*2ajaCov( y; ,y5) = (2)? (2) + (0)? (1) + ( -3)? (4) 
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*2(2) (1) ( -1) +2(2)( -3)(2) +2(1)( -3) (1) =11 
这 些 结果 表明 t 的 概率 分 布 以 E(《 ) =u 25 为 中 心 , 并 且 它 它 的 离散 性 由 ee = VV) = Vli =3.3 


来 度量 . 如 果 随 机 选取 Y. Y, 和 Y, 的 值 , 按照 经 验 法 则 , 我 们 将 期 户 


-1.6 -11.6 rp. 


望 的 值 落 到 区 间 z, + 2cr 或 


VY, Ys Y, 是 一 个 取 自 均值 为 有, 方差 为 o2 的 总 体 的 二 个 独立 观测 值 样本 , 求 样本 


均值 了 的 期 望 信和 方 关 
解 样本 观测 值 了 LY, Les Y, 


Y, 可 以 看 作 是 个 独立 随机 变量 的 观测 值 , 其 中 了 对 应 第 一 个 观测 


f, Y, 对 应 第 二 个 , 等 等 . 因此 ， 样本 均值 7 是 一 个 有 概率 分 布 (或 密度 函数 ) 的 随机 变量 . 


记 


ys 





我 们 看 到 7 是 Y, Yz, 
立 的 , 由 定理 6.5, 对 所 有 ix j, 


> Y, Y 


= 一 + 一 二 + 一 
n 


Y, 的 一 个 线性 函数 ， 且 ol =a, = 
Y, 和 的 协 方差 都 等 于 0. 因此 
em «(Te (er 


oi = 也 -[1) = «(i Jets 


Y; Y, 


n 
LES 由 于 YY, Y, 是 独 
6 和， 


et 
un (ae E 


假设 例 6. 16 中 的 总 体 有 均值 人 = 10 和 方差 0? =4. 描述 基于 n=25 个 观测 值 的 样本 均值 


的 概率 分 布 . 


解 由 例 6.16, 我 们 知道 样本 均值 的 概率 分 布 有 均值 和 方差， 


— — 2 
E(Y)-u-10 和 e$ = VQ) =% = 


所 以 ， 


4 
25 


=Z =0.4 


因此 ,7 的 概率 分 布 将 以 — - 10 为 中 心 ， 并 且 分 布 的 大 部 分 将 落 到 区 间 ;, +207 或 10 + 
2(0.4) 或 9.2 ~10.8 H. 在 本 章 其 余 几 节 , 我 们 将 学 习 更 多 有 关子 的 概率 分 布 的 性 质 . 


(3) 应 用 练习 

6.46 HEF. 参考 练习 6.2. GR BIA BT, o Ou 
数 之 和 ( 工 + Y) 的 均值 和 方差， 

6.47 卡车 道上 的 红 灯 . 参考 练习 6.5. R(X +Y) f] 
方差 . 你 期 望 (+ 了 ) 落 到 什么 范围 内 ? 

6.48 汽车 服务 参考 练习 6. 12. 求实 际 上 服务 车 辆 
所 花 时 间 (X- 了 ) 的 方差 . 

6.49 产品 中 的 次 品 率 ， 某 制造 工序 生产 的 每 批 商 
Bh BUCH EOS p. 由 这 个 工序 生产 的 n 个 产品 的 随 
机 样本 中 , 它 的 次 品 数 了 服从 二 项 分 布 , 求 样本 中 


次 品 比例 了 = Y/n 的 期 望 和 方差 . (E =, 把 p 记 为 
单个 随机 变量 了 的 线性 函数 ， 即 $= a, Y, 其 中 
a, =1/n.) 

6.50 计数 微生物 . (英国 ) 肯 特大 学 的 研究 者 建立 
了 在 液体 中 计算 微生物 菌落 个 数 的 模型 (Journal of 
Agricultural, Biological, and. Environmental Statistics , 
2005 £F 6 H). 菌落 的 期 望 个 数 在 “抑制 "模型 得 
到 , 考虑 一 个 微生物 种 A. 假设 n 个 4 孢子 存放 在 
陪 蔡氏 培养 器 中 , 设 了 等 于 生长 的 物种 A 的 孢子 


个 数 , 那么 Y = Yx. 其 中 , 如 果 物 种 4 孢子 生 
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o 


o 


长 , X =1; 如 果 物 种 4 孢子 的 生长 受到 抑制 ， 

X, 20. 

a. WEH: E(Y) 2 np, oh p= P(X, 21). 

b， 在 另 一 个 模型 中 , 研究 者 证 明了 p= PCX, 21) 
依赖 于 陪 替 氏 培 养 器 中 肥料 的 总 量 S, 其 中 p = 
e ,有 上 且 6 是 一 个 常数 . 在 他 们 所 有 的 试验 中 ， 
放 在 陪 蔡氏 培养 器 中 的 肥料 基本 相等 . 对 这 些 
试验 , 解释 为 什么 有 EY) = ne `“. 


.51 激光 打印 机 用 纸 . 商业 印刷 中 心 每 天 用 于 激光 


打印 机 的 纸张 总 量 了 为 指数 分 布 , 均值 等 于 5 箱 
( 即 B8=5). 每 天 纸 的 成 本 与 C= (37+2) 成 比例 ， 
求 每 天 激光 打印 机 用 纸 成 本 的 概率 密度 函数 . 


.52 污染 排放 量 . 环境 工程 师 已 确定 在 一 个 岛 上 的 


发 电厂 排放 管道 附近 收集 的 每 个 水 样 中 污染 物 总 
量 (以 百 万 分 之 一 为 单位 ) 有 概率 密度 函数 : 

l 上 

10 r0 «y«10 

0 ”其 他 

已 研制 一 种 新 的 净化 设备 以 帮助 减少 排放 到 海洋 
中 的 污染 物 . 当 设备 运转 时 排放 的 污染 量 4 认为 和 
Y HX: 


f) -| 


若 0<y<5$ 


> 
2 
Az 
s # 5 <y<10 
求 4 的 概率 密度 函数 . 


-53 ”电路 的 电压 . 加 利 福 尼 亚 大 学 (伯克利 ) 的 研 


究 人 员 开 发 了 一 个 转换 - 电容 器 电路 , 用 于 产生 
伪 随 机 信号 (International Journal of Circuit Theory 
and Applications, 1990 年 5/6 H ). 信号 (电压 ) 的 强 
度 了 用 均值 为 的 瑞 利 概率 分 布 作为 模型 , 这 个 连 
SUE E ERR: 


fo» D ME (y »0) 


求 随机 变量 W = 站 的 密度 函数 . 你 能 正确 叫 出 这 
个 分 布 的 名 字 吗 ? 


.54 选取 一 个 随机 样本 . 用 定理 6.7, 从 概率 密度 
函数 为 
_[e 若 y<0 
/9-l5 um 


的 分 布 中 选取 一 个 有 n=5 个 观测 值 的 随机 样本 . 


.55 选取 一 个 随机 样本 . 用 定理 6.7, 从 a=2 且 


B=1 的 6 分布 中 选取 一 个 有 n=5 个 观测 值 的 随机 
样本 . 


6.56 ”超级 计算 机 的 CPU 时 间 . 从 超级 计算 机 任务 
的 提交 到 运行 完成 的 总 时 间 X( min) 和 运行 前 在 队 
列 中 等 待 的 时 间 了 有 联合 密度 : 

e” #0O=<y=x < om 
fon = lo 其 他 

任务 的 CPU 时 间 ( 即 任务 受 超级 计算 机 的 中 心 处 

理 器 控制 的 时 间 长 度 ) 由 差 W =X - Y 88 H. 求 一 个 

任务 的 CPU 时 间 的 密度 函数 . [提示 : 确定 密度 渗 

数 时 可 利用 以 下 事实 

P(W x x) = P(W x w,X >w) 

+P(W = w,X xw) 
= P(X -—u < Y < X,u < X < % ) 
+ P(0 < Y < X,0 < X < x) 


= [ [ees + f f 67s 
和 
[ye à = — ye? + feày 
© 理论 练习 
6.57 IBEY,,Y, 8n Y, 是 随机 变量 , 有 (mw =0,0? = 
2),(u, = -1,ø =3), (m =5, o; z9),Cov(Y,, 


Y,) -1,Cov( Y, ,Y,) 24 Hl Cov(Y,, Y.) = -2. RF 
式 的 均值 和 方差 : 


£ =Y -Y, +2Y, 
6.58 BÆ Y,,Y,,Y, £l Y, 是 随机 变量 , 有 


E(Y,) -2, 
E(Y;) -4, 


V(Y,) 24,Cov( Y, ,Y;) = - 1,Cov( Y, ,Y,) =0 
VY) -8,Co(Y,,Y,) =1, Cov(Y,,Y,) 22 


E(Y,) = -1,V(V,) =6,Cov( Y, ,Y, = ,Cov(Y, Y4) =0 


K(Y,)=0, V(Y,)=1 

求 下 式 的 均值 和 方差 : 
€ = -3Y, +2Y, +6Y, - Y, 

6.59 iY, Y, e Y, 是 一 个 从 a=1 和 B=2 的 下 
分 布 中 选 出 的 = 个 独立 观测 值 的 样本 . 证 明 样本 均 
值 ;的 期 望 和 方差 与 参数 为 w =n 和 B=2/n 的 T 分 
布 的 期 望 和 方差 相同 . 

6.60 ”考虑 密度 函数 : 

e 若 y>3 


AD = MUR 
R W BS BERE, Xx HL. 


-Y 
a Wze 


- (7 -3) 
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b. W=Y-3 3k W BUSES HERES, 这 里 : 
c. WzY/3 a W = 
6.61 考虑 密度 函数 : b. W=2Y-1 
x* 2y 如 果 0<y<1 c. W=1/Y 
fo Ta sma 
6.7 抽样 分 布 


回想 样本 中 的 =” 个 测量 值 可 以 看 作 个 随机 变量 Y, LY, sos Y, 的 观测 值 . 因此 样本 均值 7, 样本 
方差 S2 和 其 他 统计 量 都 是 随机 变量 的 函数 一 一 就 是 我 们 将 在 以 后 章节 中 用 于 推断 总 体 参 数 的 函数 ， 
因此 , 前 几 节 提出 的 概率 和 概率 分 布 理论 的 主要 理由 可 以 让 我 们 寻找 并 评价 统计 量 的 概率 分 布 的 性 
质 . 这 样 的 概率 分 布 通常 称 作 统计 量 的 抽样 分 布 . 与 单个 随机 变量 情况 一 样 , 它 的 均值 是 统计 量 的 期 
望 值 ， 它 的 标准 差 称 为 统计 量 的 标准 误 . 

定义 6.13 一 个 统计 量 的 抽样 分 布 是 它 的 概率 分 布 . 

定义 6.14 一 个 统计 量 的 标准 误 是 其 抽样 分 布 的 标准 差 . 

6.6 节 提 到 的 那些 数学 技巧 可 以 用 于 求 统 计量 的 抽样 分 布 . 除了 简单 的 例子 外 , 这 些 方法 很 难 应 
用 . 另 一 个 方法 是 用 计算 机 模拟 抽样 分 布 (这 是 6. 8 节 的 主题 . ) 

即使 我 们 不 能 得 到 一 个 统计 量 的 概率 分 布 的 精确 数学 形式 , 也 不 能 用 模拟 方法 近似 , 但 我 
们 总 可 以 用 第 4 ~6 章 的 方法 求 出 它 的 均值 和 方差 , 然后 用 经 验 法 则 得 到 抽样 分 布 的 一 个 近似 
描述 . 


6.8 用 蒙特 卡 罗 模 拟 逼 近 抽 样 分 布 


考虑 统计 量 W, 它 是 nn 个 样本 测量 值 Y Yo, Yn 的 函数 . 已 经 证 明了 (6.6 节 ) 怎样 用 概率 论 
和 数学 方法 求 它 的 抽样 分 布 , ZR DR f Cw) 的 数学 问题 常常 很 难 解决 . 当 这 种 情况 发 生 时 , 我 们 可 以 
利用 随机 数 发 生 器 , 通过 重复 产生 统计 量 WW 的 观测 值 , 找到 Cw) 的 近似 . 这 种 方法 称 为 蒙特 卡 罗 模 
W. 检查 得 到 的 殉 的 直方 图 , 我 们 可 以 近似 f(w). 

为 了 说 明 这 个 过 程 , 考虑 n=2 个 观测 值 的 样本 之 和 下 = 了 + Y 的 抽样 分 布 的 近似 . 这 里 si , Y, 
是 区 间 0<Y<1 上 均匀 分 布 的 观测 值 . 回忆 : —- 
我 们 在 例 6. 13 中 得 到 的 抽样 分 布 的 精确 表 
zn, 就 能 够 把 模拟 的 抽样 分 布 和 抽样 分 布 的 
精确 形式 进行 比较 , 见 图 6. 9b. 

开始 蒙特 卡 罗 模 拟 , 先 用 SAS 产生 
10 000 对 随机 数 , 每 一 对 都 表示 来 自 区 间 
0<Ys1 上 均匀 分 布 样本 (yi,y ). 然后 用 
SAS FEE TE SE 8E— XT BJ 40 W = Y, + Y,. 图 
6.11 给 出 了 10 000 ^ W (& BJ SAS 相对 频 o l.l nr o BR 
率直 方 图 . 比较 图 6.9b 和 6.11, 你 可 以 看 0 042 024 036 0.48 08 072 064 as 10 12 130 144 156 168 19 192 
到 模拟 的 抽样 分 布 为 来 自 于 均匀 分 布 的 ii 
n 22 个 观测 值 的 样本 之 和 的 真实 概率 分 布 图 6.11 用 SAS 模拟 两 个 (0,1) 上 均匀 随机 
提供 了 一 个 好 的 近似 . 变量 和 的 抽样 分 布 
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对 来 自如 图 6. 12 所 示 的 均匀 概率 分 布 的 n=5 个 观测 值 的 样本 模拟 样本 均值 











y 4 th rr fü) 
的 抽样 分 布 . HOST AE u = 0.5. 对 n=15,25,50 和 100 重复 10 
这 一 过 程 . 解释 这 些 结果 . 0.5 
解 利用 SAS 的 RANUNI 子 程序 得 到 10 000 个 来 自 区 间 (0,1) 上 ~ Lv， 
均匀 概率 分 布 的 大 小 为 n=5 的 随机 样本 , 用 SAS 编程 计算 每 一 样本 的 ` 
均值 图 6.12 456.18 的 均匀 分 布 
v Y, + Y, + Y, + Y, +Y; 
25 5 


10 000 个 来 自 均匀 分 布 的 Y 值 频数 直方 图 , 见 图 6. 13 的 MINITAB 输出 的 左上 角 ， IXA n f 
意 它 的 形状 . 
Histogram of YBARS, YBAR15, YBAR25, YBAR 50, YBAR100 
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图 6.13 模拟 的 (0,1) 上 均匀 随机 变量 均值 的 抽样 分 布 ,mn =5,15,25,50 和 100 


基于 大 小 为 n=15,25,50 和 100 的 样本 , 7 的 相对 频率 直方 图 也 f) 
可 由 计算 机 模拟 得 到 , 见 图 6. 13 的 其 他 部 分 . 注意 7 值 有 向 均匀 分 布 
的 均值 j=0.5 聚集 的 趋势 . 进一步 , BERE n 的 增 大 , 抽样 分 布 的 方差 
越 来 越 小 . 从 图 形 中 还 可 以 看 到 , 随 着 样本 容量 的 增 大 ,7 的 抽样 分 布 
的 形状 趋向 于 正 态 分 布 的 形状 (对 称 的 丘 形 ). 0.10 
ARMEA 重复 例 6. 18 的 做 法 ,但 样本 来 自 于 均值 为 B= 1 指数 概率 
分 布 ( 见 图 6. 14). 

解 利用 SAS 的 RANEXP 函数 , 来 自 指数 分 布 的 大 小 为 n zd * 
15,25,50 和 100 的 样本 , 模拟 Y 的 抽样 分 布 . 这 些 模拟 的 抽样 分 布 的 
直方 图 见 图 6. 15 的 MINITAB 输出 . 注意 到 较 早 给 出 的 三 条 性 质 ， 图 6.14 例 6. 19 的 指数 分 布 


0.20 


J 
4 


2 
a% B = 1) 
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(1) 了 了 值 有 向 指数 分 布 的 均值 凡 = 1 聚集 的 趋势. 

(2) 了 的 方差 随 着 ”的 增 大 而 减 小 

(3) 了 抽样 分 布 的 形状 ， 随 着 n 的 增 大 趋向 于 正 态 分 布 的 形状 . 
在 6. 9 节 中 , 我 们 以 定理 的 形式 一 般 化 例 6. 18 和 例 6. 19 的 结果 
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图 6. 15 模拟 的 指数 (B = 1) 随机 变量 均值 的 抽样 分 布 , n =5,15,25,50 和 100 


(@) 应 用 练习 6.63 中 位 数 的 抽样 分 布 . 用 蒙特 卡 罗 模 拟 近似 来 自 


6.62 S Mrs. 用 蒙特 卡 罗 模拟 近似 5 的 抽样 分 于 (0,1) 区 间 上 均匀 分 布 的 n=50 个 观测 值 样本 中 


位 数 M 的 抽样 分 布 . 
布 , S 是 来 自 F 列 分 布 的 n=100 个 观测 值 样本 的 方差 š Re ii — 
a. (0, D 区 间 上 的 均匀 分 布 6.64 极 差 的 抽样 分 布 . 用 蒙特 卡 罗 模 拟 近似 来 自 于 


b. 均值 为 0、 方差 为 1 的 正 态 分 布 人 
c. 均值 为 1 的 指数 分 布 . i 


6.9 均值 与 和 的 抽样 分 布 


在 例 6. 18 和 例 6. 19 中 ,基于 均匀 分 布 、 正 态 分 布 和 指数 分 布 的 独立 随机 样本 的 样本 均值 的 
抽样 分 布 的 模拟 体现 了 统计 学 上 最 重要 定理 之 一 的 思想 . 下 面 形式 的 定理 用 于 样本 均值 了 的 抽样 
分 布 . 

定理 6. 9 ( 中 心 极限 定理 ) WR n ARAME Y, Y, ，… Y, 的 随机 样本 来 自 有 限 均值 凡 和 方差 
C 的 总 体 , 那么 当 nn 充 分 大 时 ， 样本 均值 了 的 抽样 分 布 可 由 正 态 密度 函数 近似 
Y 的 抽样 分 布 , 除了 对 于 足够 大 的 n 可 由 正 态 分 布 近 似 外 , 还 有 其 他 的 已 知 特性 , 由 定义 6.15 
给 出 . 

定义 6. 15 设 了 ,Ya，… Y, ARB FARI Au 和 有 限 标准 差 0 的 总 体 n 个 观测 值 的 随机 样 
本 . 那么 Y 的 抽样 分 布 的 均值 和 标准 差 , 记 为 J 和 o, 分 别 是 : 

My =K,07 = o7 fn 
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中 心 极限 定理 和 定义 6. 15 的 意义 是 , 只 要 总 体 的 均值 和 方差 有 限 , 且 样 本 的 观测 个 数 n 足够 
K, 那么 我 们 就 可 以 用 正 态 分 布 近似 样本 均值 了 的 抽样 分 布 ， 多 大 的 样本 量 必须 依赖 于 被 抽样 总 体 
的 性 质 . 你 可 以 从 例 6. 18 和 例 6. 19 模拟 试验 看 到 ,对 于 均匀 分 布 和 指数 分 布 , 小 到 n=25 时 ,了 的 
抽样 分 布 就 非常 接近 正 态 分 布 ， 当 总 体 分 布 关 于 均值 对 称 时 , 可 以 小 到 n 215, 了 的 抽样 是 乒 形 的 ， 
且 接 近 正 态 . 另外 , 如 果 被 抽样 总 体 是 正 态 分 布 , 那么 不 管 样本 量 的 大 小 , 了 的 抽样 分 布 仍 是 正 态 分 
布 . 事实 上 ,可 以 证 明正 态 分 布 随机 变量 的 任意 线性 函数 的 抽样 分 布 都 是 正 态 分 布 , 既 使 它们 是 相 
关 的 , 有 不 同 的 均值 和 方差 . 这 个 重要 结果 由 定理 6. 10 给 出 (没有 证 明 ), 并 且 举 例 说 明 . 

定理 6. 10 Hasan, ,an AER, Yi, Yoo, Y, 是 n 个 正 态 分 布 的 随机 变量 , E(Y,) =u, 
V(Yj) =o2 ,Cov( 了 Yi, 了) =oy(i=1,…,n), 则 正 态 随机 变量 的 线性 组 合 

€ =ajíY, +a,Y, + +a, Y, 
的 抽样 分 布 具有 均值 
E(€ ) =p =a tayo * +a, 
和 方差 @ 
V(€) -ajoi * a202 t tag? *20,0,0;, *20,04g,3 + *- *2a,a,0,, 
+2a,asga t: t2a,a,g5, t *2a, 18,0 


n-l,n 
的 正 态 密度 函数 . 
CREJ 假设 从 两 个 正 态 总 体 选取 独立 的 随机 样本 ，mni 个 观测 值 来 自 总 体 1,m 个 观测 值 来 自 总 
体 2 如 果 总 体 1 和 总 体 2 均值 和 方差 分 别 为 (Wi ,o?) 和 (ua 02) , Y. Y, 是 相应 的 样本 均值 RE 
(Y, - Y, ) BJ 4f. 
s NY, RU, 都 是 正 态 分 布 随机 变量 的 线性 函数 . 由 定理 6. 10, 它们 服从 正 态 分 布 ,样本 均 
值 的 均值 和 方差 ( 见 例 6.16) 是 : 
E(Y)-u; 和 VY; -Z (i=1,2) 
于 是 , € =Y, -~ 是 两 个 正 态 分 布 随机 变量 Y, 和 Y, 的 线性 函数 . 根据 定理 6 10, 6 具有 正 态 分 
#, B 
E(€ ) 2g; -E(Y,) —E(Y,) =p, -m 
VCE )=o¿=(1)2V(Y,) « (1)? (Y) +2(1)( -1)Cov( Y, Y.) 
然而 由 于 样本 是 独立 选取 的 , 所 以 Yy MY, 是 独立 的 , H Cov(Y,, Yp) =0. 因此， 
v(e ) -对 + | 
n nm 
这 样 就 证 明了 Yi ~ Y, 是 一 个 正 态 分 布 的 随机 变量 ， 上 均值 为 Qu, - uo) , 方差 为 (zj +o3] 
然而 , 中 心 极限 定理 的 典型 应 用 还 涉及 来 自 非 正 态 的 或 未 知 总 体 的 样本 , 如 例 6. 21 和 例 6. 22 说 明 
LEA 负责 设计 和 维护 航空 飞行 器 跑道 的 工程 师 传统 上 使 用 路 面 质量 的 混凝土 . 在 琉 顿 机 场 
(英国 ) 完 成 的 一 项 研究 是 评估 用 混凝土 砌 块 作为 机 场 跑 道路 面 的 合适 性 . ( Proceedings of the Institute 





O 任意 随机 变量 Y, Y, ,…,Y, 的 线性 函数 的 均值 和 方差 公式 已 在 定理 6.8 中 给 出 . 
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of Civil Engineers,1986 年 4 月 ). 飞机 跑道 西端 的 原 路 面 质量 混凝土 被 80 mm 厚 的 混凝土 砌 块 覆 盖 ， 
进行 一 系列 承载 试验 以 确定 承载 分 类 号 (LCN) 一 一 断裂 强度 的 度量 . 令 Y 表 示 跑 道 西端 25 块 混凝土 
砌 块 样本 的 平均 LCN. 

a. 在 表面 处 理 之 前 , 已 知 飞机 跑道 西端 的 原 路 面 质量 混凝土 平均 分 类 号 人 = 60, 标准 差 r = 10， 
如 果 新 混凝土 彻 块 路 面 平均 强度 与 原来 的 没有 差别 , 描述 了 的 抽样 分 布 . 

b， 如 果 新 混凝土 砌 块 路 面 的 平均 强度 与 原来 的 没有 差别 , 求 25 块 混凝土 砌 块 样 本 平均 LCN Y 
超过 65 的 概率 

c. 新 混凝土 砌 块 路 面 的 承载 板 试验 结果 是 了 =73. 根据 这 个 结果 对 于 新 路 面 的 真实 平均 LCN, 你 
能 推断 出 什么 结论 ? 

解 a 尽管 我 们 对 一 般 新 路 面 断裂 强度 (LCN) 的 相对 频率 分 布 的 形状 没有 什么 信息 , 但 是 应 用 
定理 6.9 可 以 推断 样本 的 平均 LCN 7 的 抽样 分 布 是 近似 正 态 分 布 . 另外 , 如 果 内 =60 和 og =10, 那么 
抽样 分 布 的 均值 和 标准 差 o; 由 如 下 两 式 给 出 : 


p; =u - 60 
和 
-.9 10. 
"o 4n X425 


b， 我 们 要 计算 P(Y 265), 由 于 了 服从 近似 正 态 分 布 , 有 


_ Y-u; 65-y; - 
POP» 65) =P — #1 > =r) e p( z 205) =P(Z>2.5) 
v, 9; 2 


其 中 Z 是 标准 正 态 随机 变量 . 利用 表 B.5, 可 得 
P(Z>2.5) =0. 5 -0.4938 =0. 0062 
因此 ， 
p(Y >65) =0. 0062 


c， 如 果 新 路 面 的 平均 强度 与 原来 的 没有 差别 ( 即 两 种 路 面 都 是 .=60) , 那么 我 们 得 到 混凝土 砌 
块 样本 的 平均 LCN 是 65 或 更 大 的 概率 仅 为 0.0062, 观测 到 Y=73 提供 了 新 路 面 的 真实 平均 断裂 强 
度 超过 n=60 的 强 有 力 的 证 据 . 根据 第 3 章 稀有 事件 的 基本 原理 , 有 理由 认为 , 如 果 人 = 60 , 这 样 大 
的 样本 均值 (Y=73) 是 极 不 可 能 出 现 的 . 

OOA 考 虑 重 伯 努 利 (Bermoulli) 试 验 , 每 次 试验 成 功 概率 是 p 的 二 项 试验 . 成 功 次 数 了 除 以 试 
验 次 数 n 称 作 样 本 成 功 的 比率 , 用 符号 8 = Y/n ER. 
解释 为 什么 当 很 大 时 ,随机 变量 
z b-P 


Ju 
近似 为 标准 正 态 分 布 
解 ” 如 果 记 了 (i=1,…,n) 为 第 i 次 伯 努 利 试验 的 结果 ,其 中 
[ 如 果 结果 是 成 功 
0 ”如 果 结果 是 失败 


i 
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那么 在 次 试验 中 成 功 次 数 了 等 于 rn 个 独立 伯 努 利 随机 变量 的 和 : 


x 
因此 ,p= Y/n 是 样本 均值 , 根据 定理 6. 9, 当 样本 大 小 上 大 时 , p 近似 为 正 态 分 布 . 为 求 了 的 期 望 值 和 
方差 , 我 们 可 以 把 p 看 成 单个 随机 变量 了 的 线性 函数 : 


ba n = [+ ]Y X ast 和 nay 
现在 应 用 定理 6.8, 得 到 ECC) RI VAE): 


因此 ， 


等 于 正 态 分 布 随机 变量 与 它 的 均值 p 的 偏离 ,以 它 的 标准 差 VP9775 为 单位 的 表示 , 满足 5.5 节 给 
出 的 标准 正 态 随 机 变量 的 定义 . 

中 心 极限 定理 也 可 应 用 于 满足 定理 6.9 所 述 条 件 的 个 测量 值 的 样本 之 和 ， 唯一 不 同 的 是 近似 
的 正 态 分 布 均值 为 n, 方差 为 no? 








随机 变量 和 的 抽样 分 布 
bn MAIE Y, Y, Y, 的 随机 样本 来 自 于 具有 有 限 均值 用 和 方差 0 的 总 体 ,那么 当 包 足够 大 时 ， 和 和 
yr 
的 抽样 分 布 可 由 正 态 密度 函数 近似 ， 目 EC XY.) =n, VOZY.) -no*. 








TE 6.10 r, 我 们 将 对 和 应 用 中 心 极限 定理 , 证 明 当 试验 次 数 n 大 时 ， 正 态 密度 函数 可 以 作为 二 
项 概率 密度 函数 的 近似 . 


应 用 练习 位 置 
6.65 二 秋英 暴 吉 .美国 职业 安全 与 卫生 研究 所 © 求 了 超过 550 ppt 的 概率 . 
(NIOSH) 最 近 完 成 了 一 项 评估 工人 暴露 于 二 亚 英 
2,3,7,8-TCDD 水 平 的 研究 . 新 泽 西 纽 瓦 克 化 工厂 y 020 
生产 工人 的 TCCD 水 平 (ppt) 分 布 有 均值 293ppt， Eo 
标准 差 847ppt( Chemosphere, Vol. 20, 1990). 分 布 = 





的 图 形 如 下 . ^T 0 E 1 上 1 500 zu 
对 新 泽 西 工厂 任 选 50 名 工人 的 随机 样本 , Y xx TCDD 水 平 (ppt) 

示 样 本 的 平均 TCDD 水 平 . f 

a. 求 了 的 抽样 分 布 的 均值 和 标准 差 6.66 ”混凝土 路 面 标准 . 地 质 技 术 工程 师 用 水 平 “ 压 


b. ith 了 抽样 分 布 的 草图 , 在 图 形 中 确定 均值 的 力 观 测 仪 "评估 新 建 混凝土 路 面 水 平 度 , 典型 做 法 
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6. 


是 在 路 面 上 测量 8 个 点 的 标高 . 感 兴趣 的 是 标高 之 

间 的 最 大 差距 .Journal of Performance of Constructed 

Facilities (2005 年 2 H ) 发 表 了 一 篇 关于 加 州 居 民 

住宅 路 面 水 平 度 的 论文 . 在 加 压 之 前 搜集 到 的 所 有 

1300 个 混凝土 路 面 标 高 的 最 大 差距 Y 具有 均值 

几 =0. 53 in 和 标准 差 r =0. 193 m. 考虑 一 个 选 自 这 

些 测量 的 n = 50 个 路 面 的 样本 , 并 设 了 表示 样本 

均值 . 

a 全 面 描述 了 的 抽样 分 布 . 

b. 求 P(Y>0. 58). 

c. 研究 还 表明 , 在 加 压 及 载重 之 后 测量 的 混凝土 
路 面 的 最 大 差距 的 均值 是 .=0. 58 in. 假设 从 样 
本 数据 中 得 到 了 = 0. 59 n, 讨论 这 个 样本 数据 
是 加 压 之 前 得 到 的 还 是 在 加 压 及 载重 后 得 到 的 . 


.67 管道 表面 的 粗糙 度 . 参考 练习 2.16, Anti-Cor- 


rosion Methods and Materials ( Vol. 50, 2003) 关于 石 

油管 道 表面 粗糙 度 的 研究 . 回顾 用 扫描 探测 器 测量 

T 20 节 内 部 有 涂 层 的 管道 表面 粗糙 度 Y( um). E 

虑 样本 均值 工 

a. 假设 表面 粗糙 度 分 布 的 均值 凡 = 1. 8 um, 标准 差 
0 0.5 um. 利用 这 些 信息 , 求 7 超过 1.85 um 
的 概率 . 

b. 重新 产生 的 样本 数据 见 下 表 . 计算 

c. 基于 b 的 结果 , 讨论 a 中 所 作假 设 的 有 效 性 . 


n_a 
1.72 2.50 2.16 2.13 1.06 2.24 2.31 2.03 1.09 1.40 
2.57 2.64 1.26 2.05 1.19 2.13 1.27 1.51 2.41 1.95 
资料 来 源 : Farshad, F. , and Pesacreta. T. " Coated pipe inte- 


Tior surface roughness as measured by three scanning probe in- 
struments. " Anti-Corrosion Methods and Materials , Vol. 
50. No. 1, 2003( Il ). 


-68 洗手 与 擦 手 .British Medical Journal ( 2002. 年 8 


月 17 日 ) 发 表 了 一 篇 关于 比较 用 肥皂 洗手 与 用 酒 
精 擦 手 有 效 性 的 研究 . 用 酒精 擦 手 的 卫生 保健 工作 
者 每 只 手 细菌 平均 数量 为 39, 标准 差 为 59. 而 用 
肥皂 洗手 的 卫生 保健 工作 者 每 只 手 细菌 平均 数量 
为 59, 标准 差 为 106. 在 一 个 50 位 卫生 保健 工作 者 
组 成 的 随机 样本 中 , 所 有 人 用 相同 的 方法 清洗 他 
们 的 手 , 每 只 手 的 平均 细菌 数量 7 小 于 30. 这 一 保 
健 工作 者 样本 是 用 肥皂 洗 的 手 还 是 用 酒精 擦 的 手 ， 
给 出 你 的 观点 . 

69 工程 师 的 成 本 估计 . 成 本 估计 是 用 于 描述 工 
程 师 所 用 的 估计 授予 最 低 投标 者 工程 合同 ( 例如 ， 


eo 


6. 


道路 建设 、 建 筑 物 建设 ) 成 本 的 专业 术语 . 工程 师 
的 估计 是 与 低 ( 赢得 ) 投标 比较 的 底线 . 最 近 一 项 
研究 探讨 了 影响 工程 师 估计 准确 度 的 因素 (Cost 
Engineering ,1998 年 10 月 ) ， 其 中 准确 度 是 以 工程 
师 的 估计 与 低 出 价 的 百分比 差 来 度量 的 . 最 重要 因 
素 之 一 是 投标 者 的 人 数 . 合同 投标 者 的 人 数 越 多 ， 
工程 师 越 可 能 高 估 成 本 . 对 于 有 5 个 投标 者 的 建筑 
合同 , 平均 百分比 误差 是 -7.02, 标准 差 是 24. 66. 
考虑 有 50 个 建筑 合同 , 每 个 合同 有 5 个 投标 者 的 
一 个 样本 . 
a. 描述 Y 的 抽样 分 布 ,了 是 50 个 建筑 合同 的 低 标 
价 与 工程 师 估计 的 平均 百分比 差 . 
b. 求 P(Y «0). (这 是 过 高 估计 的 概率 . ) 
c. 假设 关于 50 个 建筑 合同 的 一 个 样本 你 得 到 
Y= -17.83. 基于 给 出 的 信息 , 所 有 这 些 合同 
是 否 为 有 5 个 投标 者 的 ? 说 明 原 因 . 


“70 监控 装 入 过 程 . 路 易 斯 维尔 大 学 的 研究 人 员 


J. Usher, S. Alexander 和 D. Duggins 检查 了 混合 饼 
干 装 人 塑料 袋 的 过 程 ( Quality Engineering, Vol. 91 , 
1996). 目前 , 这 一 工序 的 装 人 平均 值 设置 为 = 
406 g, 标准 差 w =10. 1 g. (根据 研究 者 的 结果 ,“ 高 
度 变异 是 由 于 产品 的 低 流 动 性 造成 的 , 因此 -和 袋 
一 袋 地 一 致 装 人 是 困难 的 ” ) 操作 者 用 如 下 方法 监 
控 生 产 过 程 : 每 天 随机 地 抽取 36 48, 并 测量 每 袋 
混合 饼干 的 重量 . 考虑 36 个 产品 的 总 装 人 量 样本 
Y. 假设 某 一 天 , 操作 者 观测 到 了 = 400. 8. 其 中 一 
个 观测 者 认为 , 这 说 明 那 一 天 真正 装 人 过 程 的 均 
M u E6406 g 要 低 ; 而 另 一 个 操作 者 认为 及 =406 及 
观测 到 的 了 小 值 是 由 于 装 入 过 程 的 随机 变异 性 造 
成 的 . 你 同意 哪 一 个 操作 者 的 观点 ? 为 什么 ? 


“71 杀 虫 剂 的 水 污染 . 综合 痕 量 有 机 物 监 测 仪 描述 


水 管理 员 分 析 各 种 类 型 有 机 物 ( 如 污染 物 ) 的 水 样品 
常 在 处 理 水 面 找到 的 一 种 这 样 的 污染 物 是 杀 虫 齐 
(甲烷 (THM) ). 在 比 德 福 (英国 ) , 综合 痕 量 有 机 物 
水 处 理工 作 指出 平均 THM 水 平 是 51 ug/L, 标准 差 
Æ 14 pg/L. (Journal of the Institution of Water Engi- 
neers and Scientists, 1986 4E 2 H ) 假定 这 些 数字 分 别 
表示 总 体 均值 和 标准 差 c. 假定 在 比 德 福 工厂 收 
集 到 45 个 水 样本 ( 称 作 “ 水 断面 "), 并 测量 了 每 一 
样品 THM 水 平 . 

a 描述 45 个 水 断面 平均 THM 水 平 了 的 抽样 分 布 . 
b. 求 了 超过 52 ug/L 的 概率 . 

c. 求 了 落 到 49.5 ug/L 5 50.5 Mg/L 之 间 的 概率 . 

72 内燃机 系统 维护 美国 陆军 工程 和 住房 支持 中 心 
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(Army Engineering and Housing Support Center) 最 近 对 
商业 及 军用 设施 中 小 型 内 燃 机 及 气体 动力 系统 特征 的 
可 靠 性 、 有 效 性 和 持续 性 (RAM) 进 行 了 研究 (JEEE 
Transactions on Industry Applications, July/ Aug. 1990). 
研究 表明 对 连续 内 燃 机 辅助 系统 执行 纠正 保养 时 间 Y 
有 近似 指数 分 布 , 估计 的 均值 为 1 700 h. 

a 假设 人 =1700, 求 70 个 连续 内 燃 机 辅助 系统 设 
备 样 本 执行 纠正 保养 的 平均 时 间 超 过 2 500 h 的 
概率 . 

b， 如 果 你 已 观测 到 了 > 2500, ABEST u 值 进行 怎样 
的 推断 . 

6.73 机 器 停工 模型 , 在 Industrial Engineering ( 1990 
年 8 月 ) 上 一 篇 文章 用 模拟 研究 讨论 了 机 器 停工 时 
间 正 确 建 模 的 重要 性 . 作为 一 个 说 明 , 研究 者 考虑 
修理 时 间 (min) 可 用 参数 w =1, 8 =60 的 工分 布 表 
示 的 单机 床 系统 . 感 兴趣 的 是 100 个 机 器 故障 样本 
的 平均 修理 时 间 工 
a. 3k ECY) fl Var( Y). _ 

b. 什么 样 的 概率 分 布 提 供 了 Y 的 抽样 分 布 最 好 的 
模型 ? 为 什么 ? 

c. 求 平均 修理 时 间 了 不 长 于 30 min 的 概率 . 

6. 74 起 重 机 的 最 大 载重 量 . 一 台大 型 的 起 重 机 最 多 
能 够 搬运 100001b(5 t). 假设 一 个 包括 45 个 箱子 
的 货物 必须 用 起 重 机 搬运 . 经 验 表明 一 箱 这 种 类 型 
货物 的 重量 了 具有 均值 上 4 = 200 Ib, WEZ o =55 Ib 


6.10 二 项 分 布 的 正 态 逼近 


的 概率 分 布 . 所 有 45 个 箱子 同时 装 到 起 重 机 被 搬 
运 的 概率 是 多 大 ? (提示 ; 求 P ( Èr < 


10 000 ) ) 
理论 练习 
6.75 设 户 是 六 次 二 项 试验 中 成 功 的 样本 比率 , p, 


表示 n, 次 二 项 试验 中 成 功 的 样本 比率 , 与 第 一 次 
试验 独立 进行 的 . < p, 和 p, 是 相应 总 体 的 参数 . 
24 n, 和 nn 很 大 时 , 证 明 : 


P -p - (Pı -p:) 


Pidi P242 
Pun P 
n, n 


Z- 


近似 为 标准 正 态 分 布 . 

6.76 如 果 Y 服 从 自由 上 度 为 n 的 Xx 分 布 ( 见 5.7 
节 ) ,那么 Y 可 以 表示 为 Y = YX, , rb X, 是 独 
立 的 x 分 布 , 每 个 自由 度 为 1. 

a. 证 明 : 当 n 较 大 时 , Z = (了 -n)/ V2n 近 似 地 服 
从 标准 正 态 分 布 - 
b. 如 果 了 服从 自由 度 为 30 的 x 分 布 , 求 了 落 在 它 


的 均值 的 2 个 标准 差 范围 内 的 近似 概率 ， 即 求 
P( -20 «Y «yu +20). 


考虑 参数 为 n 和 p 的 二 项 随机 变量 Y,， 回顾 了 有 均值 凡 = np, 方差 o2 = npq. 在 例 6. 22 中 已 经 证 


明 在 次 试验 中 , 成 功 次 数 了 可 以 认为 是 n 个 0 和 1 值 的 和 , 每 个 0 和 1 分 别 表示 某 次 试验 的 结果 
(分 别 为 失败 或 成 功 ) ， 即 
1 如果 成 功 

Y= 多 其 中 = lo 如 果 失 败 
则 根据 和 的 中 心 极限 定理 , 24 n AA, 二 项 概率 分 布 p(y) 越 来 越 接近 于 正 态 分 布 . 即使 对 于 小 样本 情 
UL, 如 小 到 10, 当 p =0.5, 了 的 分 布 关于 它 的 均值 =np 是 对 称 时 ,二 项 分 布 的 正 态 近似 是 合理 有 效 
的 . 当 p 接近 0( 或 1) 时 , 二 项 概率 分 布 将 趋 于 偏向 右 (或 左 ), 但 是 偏 度 随 着 n 的 增 大 而 消失 . 一 般 地 ， 
当 RUE, 使 人 -2c =np -2 /npgfllu * 2a = np +2 y npe 0 和 nn 之 间 时 , 近似 程度 是 很 好 的 . 可 以 
证 明 ( 证 明 省 略 ) , 对 于 人 -2c 和 人 +2c 都 没有 落 在 0 和 之 间 , np 和 ng 一 定 都 大 于 或 等 于 4. 





对 二 项 概率 分 布 用 正 态 近似 要 求 的 条 件 


TR ju -20 = np - 2/npqft u +2o =np+2Vnpq 都 在 0 fun Z |l, 近似 是 好 的 ， jË np>4 H nq24, W 
么 这 个 条 件 就 会 得 到 满足 . 
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LINER 设 Y 是 具有 参数 n=10, p 20.5 的 二 项 概率 分 布 . 
a. 作 p(y) 图 , 并 在 图 上 添加 =np, o= Vnpg 的 正 态 分 布 . 








b. 用 表 B.2 K P(Y=<4). atl 

c. 用 二 项 分 布 的 正 态 近似 求 PCY 4) 的 近 
似 值 . 

解 a p(y) 及 

p -2npz-z(10)(0.5) =5 BM P 

和 FOXIUROYOKUS £OYUW Y HP 

a= npo = v (10) (0.5) (0.5) - 1. 58 图 6. 16 二 项 概率 分 布 (n=10, p =0.5) 与 近似 正 
的 正 态 分 布 的 图 形 见 图 6. 16. 注意 到 , np =5 #l nq 态 分 布 (4L=m=5, o= /npg =1.58) 


=5 都 超过 了 4. 因此 j=5, o =1.58 的 正 态 密度 
函数 是 p(y) 的 一 个 好 的 近似 . 
b. 从 表 B.2 得 ， 


4 
$ p(y) = 0.377 
7=0 


c. 观察 图 6. 16, 可 以 看 到 P(Y<4) 是 在 正 态 曲线 下 了 =4. 5 的 左 端面 积 . 注意 到 了 =4 的 左 端面 
积 是 不 合适 的 ,因为 它 省 略 了 相应 于 Y=4 的 一 半 概 率 长 方形 . 为 了 修正 ， 用 连续 概率 分 布 去 近似 离 
散 概 率 分 布 , 在 计算 概率 之 前 我 们 需要 将 4 增加 0.5. 值 0.5 称 作 二 项 概率 正 态 近 似 的 连续 性 修正 因 
子 〈 见 下 面 框 格 ) ,相应 于 修正 值 Y=4.5 的 Z 值 是 ; 


7-Z-L_45-5_ -0.5 
c ， 1.58 ` 1.58 





= ~0. 32 


K B. 5 给 出 了 Z=0 lJ Z =0. 32 之 间 的 面积 是 4 = 0. 1255. 因此 ， 
P(Y=<4) =0.5 -4=0.5-0.1255 =0. 3745 


这 样 , 尽管 4 小 到 10, 对 P(Y<4) =0.377 的 正 态 近似 是 相当 好 的 . AU p 不 等 于 0.5, 那么 利用 近 
似 时 样本 量 必须 较 大 . 





二 项 概率 正 态 近 似 的 连续 性 修正 
设 了 是 具有 参数 n 和 p 的 二 项 随机 变量 , Z 是 标准 化 随机 变量 . 那么 


¿a s= 


Porsa) =p (2> (6631) 


v npq 


P(a=Y=b) _ i" s ) 
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应 用 练习 


6. 


9 


77 半导体 晶片 的 缺陷 . 笔记 本 和 台式 电脑 的 计算 
机 芯片 是 由 半导体 唱片 制造 的 . 某 种 半导体 唱片 放 
置 在 每 个 晶片 多 达 100 个 可 能 瑕 症 的 环境 中 . 如 果 
制造 过 程 是 稳定 的 , 且 产 生 的 缺陷 随机 地 分 布 在 
晶片 上 , 那么 每 个 晶片 的 缺陷 数 了 服从 二 项 分 布 . 
(IEEE Transactions on Semiconductor Manufacturing , 
1995 4E 5 月. ) & p 表示 在 唱片 的 100 个 点 中 任 一 
点 出 现 缺 陷 的 概率 . 对 于 下 面 的 每 一 种 情况 , 确定 
是 否 能 用 正 态 近 似 刻 画 Y. 

a. p=0.01. 

b. p=0. 50. 

c. p=0.90. 


.78 与 学 习 有 关 的 工程 工作 . 你 未 来 所 从 事 的 工作 


怎样 才能 很 好 地 反映 你 在 大 学 里 学 习 过 的 工程 学 
课程 ? 回顾 (练习 2.2) 对 Mechanical Engineering 
(2004 年 11 月 ) 读 者 的 调查 , 约 30% 认为 他 们 的 
工作 和 他 们 在 大 学 里 工程 学 学 习 有 密切 联系 . 在 一 
个 50 名 工程 类 本 科 毕 业 生 的 随机 样本 中 , 考虑 认 
为 他 们 的 工作 与 工程 学 学 习 有 密切 关系 的 人 数 Y. 
求 下 列 近 似 概率 : 

a. Y<10. 

b. Yz25. 

c. 20xYzx30. 


. 79 生物 毒 理学 的 生存 研究 . 参考 练习 4.24, Jour- 


nal of Agricultural, Biological and Environmental Sci- 
ences(2000 年 9 月) 评估 由 危险 污染 物 引 起 的 风险 . 
在 试验 中 , 孔雀 鱼 (年 龄 和 大 小 全 都 相同 ) 放 进 盛 
着 已 被 农药 污染 的 天 然 海水 的 大 容器 里 , 确定 5 天 
后 还 活着 的 孔 誉 鱼 个 数 , 回忆 研究 者 估计 任意 单条 
筷 瞧 鱼 活着 的 概率 是 0. 6. WRA 300 RIER 
进 污 染 的 大 容器 中 , 估计 5 天 后 活着 的 孔雀 鱼 的 个 
数 少 于 100 的 概率 . 

80 # & 6) # ;# XS. Consumer Reports ( 1992 年 2 
月 ) 称 在 纽约 及 芝加哥 超市 里 , 发 现 海产 品 有 普遍 
污染 . 例如 40% 的 供销 售 的 箭 鱼 片 超过 了 食品 和 医 
2 Bl Jay (FDA) REER. 考虑 来 自 纽约 和 芝 加 


哥 超 市 20 个 箭 鱼 片 的 随机 样本 . 
a. 用 二 项 分 布 的 正 态 近 似 计 算 20 个 箭 鱼 片 中 有 少 
于 2 个 超过 FDA 限制 的 汞 含量 的 概率 . 


b. 用 二 项 分 布 的 正 态 近似 , 计算 20 个 箭 鱼 片 中 有 
多 于 一 半 超 过 了 FDA 的 限制 的 未 含量 的 概率 . 
c. 用 二 项 表 计 算 a RI b 中 的 正确 概率 . 正 态 分 布 是 


6. 


o 


o 


D 


o 


二 项 分 布 的 一 个 好 的 近似 吗 ? 

81 瓶装 水 分 析 . 参考 练习 4. 25 ,Scientific American 
(2003 年 7 月 ) 关 于 瓶装 水 是 否 是 真正 的 纯净 水 的 
报告 . 回顾 自然 资源 保护 委员 会 (Natural Resources 
Defence Council) 发 现 25% MZK mh, 只 是 自 来 
水 装 在 它们 瓶 里 ， 在 一 个 65 种 瓶装 水 品牌 的 随机 
样本 中 , 可 能 会 有 20 种 或 更 多 品牌 装 有 自来水 吗 ? 
说 明 原 因 . 


.82 桥梁 检测 等 级 . 参考 练习 4.26, Journal of Per- 


Jormance of Constructed Facilities (2005 年 2 H ) 关 于 
检测 所 有 主要 的 丹佛 桥梁 的 等 级 研究 . 回顾 全 国 桥 
粱 检测 级 别 标准 (NBIS ) 排序 等 级 从 0( 最 差 等 级 ) 
到 9( 最 高 等 级 ). 工程 师 预 测 所 有 主要 丹佛 桥梁 的 
9% 在 2020 年 的 等 级 将 会 是 4 或 更 低 . 
a. 在 70 座 主要 丹佛 桥梁 的 随机 样本 中 , 用 预测 近 
似 在 2020 年 至 少 一 半 等 级 为 4 或 更 低 的 概率 . 
b. 假设 你 在 2020 年 确实 观测 到 在 有 70 座 桥 梁 的 
样本 中 至 少 有 35 座 等 级 为 4 或 更 低 , 你 能 得 到 
什么 推论 ? 为 什么 ? 


-83 数据 流程 图 . 开发 成 功 的 信息 系统 的 关键 之 一 


是 完成 结构 设计 和 编程 方法 . 计算 机 辅助 软件 工程 
(CASE) 技 术 提供 了 一 些 自助 工具 ( 如 数据 流程 图 ) 
能 够 使 得 结构 算法 更 加 容易 . Journal of Systems 
Management(1987 年 7 月) 报告 称 60% 的 信息 系统 
( 苞 ) 专 业 技 术 人 员 在 他 们 的 工作 中 广泛 使 用 了 数 
据 流程 图 . 在 一 个 有 150 个 IS 专业 技术 人 员 的 样本 
中 , 至 少 有 一 半 广 泛 使 用 数据 流程 图 的 近似 概率 
是 多 少 ? 
84 女性 清水 墙 安 装 工 . Occupational outlook Quar- 
terly( 1993 年 春 ) 报告 称 在 建筑 工业 有 196 的 清水 墙 
安装 工 是 女性 . 
a. 求 在 500 个 清水 墙 安装 工 的 随机 样本 中 , 有 超 
过 100 个 女工 的 近似 概率 . 
b. 求 在 500 个 清水 墙 安装 工 的 随机 样本 中 , 有 5 
个 或 更 少女 工 的 近似 概率 . 


.85 机场 行李 检查 . 根据 New Jersey Business 


(1996. 2) , 纽 瓦 克 国际 机 场 新 的 航空 终点 站 平均 
每 小 时 处 理 3 000 名 国际 旅客 , 但 有 能 力 处 理 这 个 
数量 的 2 倍 . 由 于 到 达 的 国际 旅客 80% 无 需 检查 他 
们 的 行李 而 通过 , 其 他 的 旅客 等 待 检 查 . 检查 设备 
每 小 时 能 够 处 理 600 名 旅客 , 不 会 不 合理 地 延误 
旅行 . 

a， 当 国际 旅客 以 每 小 时 1500 名 的 速度 到 达 时 , 由 

于 行李 检查 而 等 待 的 旅客 期 望 数 是 多 少 ? 
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b. 未 来 的 期 望 每 小 时 有 多 达 4 000 名 国际 旅客 到 c. 参考 b. 求 由 于 检查 行李 , 致使 多 于 600 名 国际 





ik. 到 那 时 由 于 检查 行李 而 等 待 的 旅客 数 期 望 旅客 等 待 的 近似 概率 .( 这 也 是 旅客 经 历 不 合理 
是 多 少 ? 行李 检查 而 延误 的 概率 ) 


6. 11 与 正 态 分 布 有 关 的 抽样 分 布 


在 这 一 节 里 , 我 们 给 出 基于 正 态 总 体 观 测 值 的 随机 样本 的 几 个 著名 统计 量 的 分 布 , 这 些 统计 量 
是 好, 上 和 下 统计 量 . 在 第 7 章 , 我 们 将 证 明 如 何 用 这 些 统计 量 估计 某 些 总 体 参数 值 . 下 面 只 叙述 结 
论 而 不 给 出 证 明 . 利用 6. 2 节 方 法 的 证 明 可 在 本 章 末 的 参考 文献 中 找到 . 

定理 6. 11 ”如 果 半 个 观测 值 矶 LY, o LY, 的 随机 样本 取 自 均值 及, 方差 o2 的 正 态 分 布 ， 那么 

2 (a-1)8? 


g? 


的 抽样 分 布 是 自由 度 为 z= (n -1) 的 卡 方 密度 函数 ( 见 5.7 节 ). 

注 : 随机 变量 S 表示 样本 方差， 

定理 6. 12 ”车 好 和 好 是 自由 度 分 别 为 和 vw 的 独立 卡 方 随机 变量 , iy +y 是 自由 度 为 
vi tb, 的 卡 方 分 布 . 

定义 6.16 设 2 是 标准 正 态 随机 变量 , 2 是 自由 度 为 了 的 卡 方 随机 变量 ， 如 果 忆 与 12 独立 ， 
那么 称 

Z 
yv 
是 自由 度 为 的 学 生 氏 了 了 分布 . (或 简称 T 48). 
定义 6. 17 PRA 和 好 是 自由 度 分 别 为 z dev, 的 卡 方 随机 变量 , 22 2 和 要 是 独立 的 ,， 则 称 
Xi/ vi 
为 分 子 自由 度 为 v1 ,分母 自 由 度 为 v, 的 下 分 布 . 

注 : 对 于 了 和 正统 计量 的 抽样 分 布 也 可 用 选 学 的 6.6 节 方 法 导出 . 两 个 抽样 分 布 都 与 B 型 随机 
变量 的 密度 函数 ( 见 5.9 节 ) 有 关 . 可 以 证 明 ( 证 明 略 ) 自由 度 为 了 的 了 分 布 实际 上 是 自由 度 n=l, 
v,-v 的 下 分 布 的 特殊 情形 . 由 于 不 能 得 到 累积 分 布 函数 的 显 式 表达 ， 因 此 , 我 们 省 略 了 密度 函数 公 
式 ， 在 附录 B 以 表格 形式 给 出 统计 量 的 有 用 值 及 相应 的 面积 . 

下 面 的 例子 说 明 , 这 些 统计 量 如 何 用 于 总 体 参 数 的 概率 描述 . 
考虑 加 工 谷 物 为 8 dini] OK MESI BUE IT. 质量 控制 工程 师 认为 当 每 听 甸 头 装 入 量 的 真 
方差 o? 小 于 0. 0025 时 , 工序 是 正常 运转 . 从 某 一 天 的 产品 中 选 出 n=10 听 的 随机 样本 , 记录 每 一 听 
KRAER). 感 兴趣 的 是 样本 方差 S2. 如 果 事实 上 o? =0.001, xk S? 超过 0. 0025 的 概率 . 假定 
装 入 量 是 正 态 分 布 . 

解 我们 要 计算 PCS? 20.0025). 假设 10 个 装 入 量 的 样本 来 自 正 态 分 布 . 定理 6. 11 说 明 统计 量 


-1)S2 
e = ) 


o? 





T= 


是 自由 度 为 v= (n-1) 的 卡 方 概率 分 布 . 因此 , 我 们 要 求 的 概率 可 写 为 : 


38 
o 
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1)S2 (n -1) (0. 0025 
DS, (n- 1 (0.002) 


o? 


(n -1) (0. 0025) 
ow | 


P(S? »0.0025) =P[ 
o 
=P|x > 
将 n=10, g? 20.001 代入 , 得 


P(S? >0. 0025) = PD? „ 2 (0. 0025) 


0 001 | = P(x% >22. 5) 

x^ 分布 的 上 尾 面 积 已 经 作成 了 表 , 并 在 表 B. 8 中 给 出 . 表 6. 2 是 其 中 一 部 分 . 这 张 表 给 出 的 好 
值 记 作 这 , 是 分 布 上 尾 面积 ( 概率) 为 o 的 位 置 , BU PO? >x) 2o. 在 这 个 例子 中 , 我 们 要 求 概率 o, 
418 y2 > 22. 5. 


36.2 表 B.8 的 节 赂 形式 : X? 值 表 
-人 人 人 ~ 














B HFE x. 100 Xi. 050 XO. 025 Xi. 010 Xi. 005 自由 度 x. 100 x. 050 Xi. 025 Xi. 010 X6. 005 
| 

1 2.70554 3.84146 5.02389 6.63490 7.87944 | 11 17.2750 19.6751 21.9200 24.7250 26.7569 
2 4.60517 5.99147 7.37776 9.21034 10.5966 | 15 18.5494 21.0261 23.3367 26.2170 28.2995 
3 6.25139 7.81473 9.34840 11.3449 12.8381 | 13 19.8119 22 362] 24.7356 27.6883 29.8194 
4 7.771944 9.48773 11.1433 13.2767 14.8602 

14 21.0642 23.6848 26.1190 29.1413 31.3193 
5 9.23635 11.0705 12.8325 15.0863 16.7496 
6 10.6446 12.5916 14.4494 16.8119 18.5476 | 15 223072 24.9958 27.4884 30.5779 32.8013 
7 12.0170 14.0671 16.0128 18.4753 20.2777 | 16 23.5418 26.2962 28.8454 31.9999 34.2672 
8 13.3616 15.5073 17.5346 20.0902 21.9550 | 17 24.7690 27.5871 30.1910 33.4087 35.7185 
9 14.6837 16.9190 19.0228 3,6860 23 9893 | 18 25.9894 28.8603 31.5264 34.8053 37.1564 
10 15.9871 18.3070 20.4831 23.2093 25.1882 | 19 27.2036 30.1435 32.8523 36.1908 38.5822 





现在 n=10, HE v-n-1z9. 找到 表 6.2 相应 于 v=9 8917, 可 以 求 出 X6010 221.666, 及 
X6.005 = 23. 5893. (这些 值 是 表 6. 2 的 阴影 部 分 . ) 因此 , 我 们 要 求 的 概率 落 在 og =0.01 M = = 0. 005 
之 间 , Hp 

0. 005 < P(x? >22.5) <0.01 ( 见 图 6.17) 
这 样 ， 当 总 体 真 方差 o? =0. 001 BF, 装 和 人 量 的 样本 方差 超过 0. 0025 的 概率 是 小 的 (在 0.005 ~0.01 
之 间 ). 


fü?) 


fax) 





0.005 < a «0.01 








0 2s 
图 6.17 $56.24 中 求 POZ 222.5) 
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ENE] 假设 随机 变量 了 和 s? Rock H EE u, 方差 为 o? 的 正 态 分 布 总 体 的 个 观测 值 随机 
MP 可 以 证 明 (证 明 略 ) 当 抽 样 总 体 是 正 态 分 布 时 ， YA S? 是 统计 独立 的 . 利用 
结果 证 明 : 
T 

S/Vn 

是 自由 度 为 = (nm -1) 的 T 4rfi 9. 
解 ”由 定理 6.10 An, 7 是 均值 为 ,方差 为 o /n 的 正 态 分 布 . 因此 ， 
Y- 


Zz 
odn 
是 一 个 标准 正 态 随机 变量 , 由 定理 6. 11 可知 ， 
2 (n-1)S2 
x ow 
是 一 个 自由 度 为 v= (n - 1) BJ 2 随机 变量 . 然后 利用 定义 6. 15 RYA S? 是 独立 的 , 可 得 
Y-p 
on  Y-u 





IA -Ds /(n-1) SA[Vm 

是 自由 度 为 w= (n -1) 的 学 生 氏 了 分 布 . 正如 第 7 7 章 将 要 学 到 的 , 当 总 体 标准 差 o 未 知 时 (必须 用 S? 
估计 ) ,了 分 布 对 推断 总 体 均值 多 是 有 用 的 . 

定理 6. 11 和 例 6. 24、 例 6. 25 指出 两 个 统计 量 的 抽样 分 布 在 统计 推断 中 具有 重要 作用 . 其 他 统 
计量 不 加 证 明 地 在 表 6. 3a 和 表 6. 3b 中 给 出 , 所 有 都 基于 来 自 正 态 分 布 总 体 的 随机 样本 , 这些 结果 
将 在 第 7 章 中 用 到 . 

表 6. 3a 基于 分 别 来 自 参数 为 (pi 01) 和 (jp o1) 正 态 分 布 
总 体 n, 和 n, 个 观测 的 独立 随机 样本 统计 量 的 抽样 分 布 








统 计 量 抽样 分 布 附加 的 假定 导出 抽样 分 布 的 依据 
2 
p UU 87$ 自由 度 为 v= (ni +m -2) el =02=07 定理 6.11 -6.12 
c 
(^; - DS +(m - 108 
其 中 8 = ni +n, -2 
(Y, -Y,) - Qa -m) 
r- C AD cn m) 定理 6.10 ~6.11 和 
I i HH BEA v = (n, +n, -2) o? =o = o? N 
S, "p ny 4E X. 6.15 
(n - -1)S$ + (ns -1)8 
其 中 5 = n, +n, -2 
r-(35(8) 分 子 自 由 度 v = (n, -1) x 定理 6.1 MÆ 
SA 分 母 自 由 度 v = (n, - 1) B F Atl X 6.17 





O 这 个 结果 首先 由 W. S. Gosset F 1908 年 以 笔名 “学 生 ” 发 表 . 之 后 , 这 个 统计 量 就 称 为 学 生 氏 工 
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表 6. 3b 基于 均值 w、 方 差 o° 的 单个 正 态 总 体 随机 样本 的 统计 量 的 抽样 分 布 
统 计 量 抽样 分 布 附加 的 假定 导出 抽样 分 布 的 依据 
y -CDS pet Xx 6.7 节 的 方法 
x 
-Y-u 自由 度 为 v=n -1 386.10 ~6.11 和 定义 6.15 
ü Sn FER 了 分 布 * æ 
应 用 练习 6.89 数学 规划 问题 . IEEE Transactions (1990.6) 提 


6.86 天 然 气 消耗 量 与 气温 . 参考 练习 5.24, Transac- 
tions of the ASME( 2004. 6) 一 项 关于 用 温度 预测 日 天 
然 气 消耗 量 的 研究 . 回顾 研究 者 已 证 明 在 阿根廷 布 
宜 诺 斯 艾 利 斯 7 月 份 的 日 温度 是 参数 j= 11%, 
c =3% 的 正 态 分 布 . 现 考虑 来 自 这 个 总 体 的 m 个 7 
月 份 的 日 温度 的 随机 样本 , 用 8? 表示 样本 方差 . 利 
用 表 B. 8 估计 下 列 概率 : 

a. 当 n=10 时 , P(S »14.4). 
b. 当 n=5 时 , P(S >33.3). 
e. 当 n=22 时 , P(S >16.7). 

6.87 监测 腿 部 运动 的 阻抗 性 . 参考 练习 2.36 IEICE 
Transactions on Information & Systems (2005. 1) 腿 部 
运动 阻抗 性 的 研究 . 回顾 工程 师 把 电极 系 在 志愿 者 
的 脚 跑 和 膝盖 上 ,并 测量 阻抗 变化 的 信 了 曲 比 
(SNR). 用 某 个 脚 躁 — 膝盖 电极 对 , 对 10 名 志愿 
者 的 样本 测试 了 SNR 值 . 假设 总 体 的 SNR 值 分 布 
1-20, o =5 的 正 态 分 布 . 

a. 描述 7=Yn( 了 -jp)/S 的 抽样 分 布 . 
b. 描述 六 = (n - S70? 的 抽样 分 布 . 

6.88 混凝土 FRP 条 的 承重 强度 . 参考 练习 2.37 
Composites Fabrication Magazine ( 2004. 9 ) 3 fri YE iR 
北 土 中 固定 纤维 增强 聚合 物 的 新 方法 . 回顾 用 机 械 
方法 固定 在 高 速 公路 桥 上 的 10 个 FRP 条 的 样本 测 
试 承重 强度 . 记录 下 每 条 强度 测量 值 Y( 百 万 帕 ， 
MPa). 假设 了 是 方差 o? = 100 的 正 态 分 布 . 

a. 描述 样本 方差 S^ 的 抽样 分 布 . 

b. 3K S? 小 于 16. 92 的 近似 概率 . 

c 下 表 重 新 给 出 试验 数据 . 这 些 数 据 与 假设 o? = 
100 矛盾 还 是 支持 ? 


aaua 
240. 9 248. 8 215. 7 233. 6 231. 4 230. 9 225. 3 247.3 235. 5 238. 0 
alumnae 


注 ; 数据 是 按 Composites Fabrication Magazine , Sept. 2004 , 
p.32( 表 1) 提供 的 汇总 信息 模拟 的 . 


出 了 一 个 解决 多 项 式 0-1 数学 规划 问题 的 混合 算 
法 . 随机 选取 混合 算法 解决 问题 所 用 时 间 (s) 具 有 
均值 4=0.8s, o =1.5 s 的 正 态 分 布 . 考虑 用 混合 
算法 求解 的 n=30 个 问题 的 随机 样本 . 

a. 描述 30 个 问题 求解 时 间 方 差 S^ 的 抽样 分 布 . 

b. 求 $ 超过 3.30 的 近似 概率 . 

理论 练习 

6.90 itn 个 观测 值 的 随机 样本 Y , Y, ,--- YQ Á 
Him, TE o1 的 正 态 总 体 , n, 个 观测 值 的 随机 
FEAS X, Ny, X, B 1S 4H u, , 方差 e; 的 正 态 
总 体 . 假设 样本 是 独立 选取 的 . 证 明 ; 

Sii oi 
"«(s)(5) 
有 具有 分 子 自由 度 为 v, = (n, 21), 分 母 自 由 度 为 
v2 = (n, —1) W Ft. 

.91 设 51 和 呆 分 别 是 来 自 参 数 为 (mu ,o?) 和 (jw， 
和 ) 正 态 分 布 总 体 的 大 小 为 和 nn 的 独立 随机 样 
本 的 方差 . 这 样 ,总体 具 有 不 同 的 均值 , 但 是 有 相 
同 的 方差 . 要 估计 公共 方差 我 们 可 以 综合 两 个 样本 
的 信息 用 合并 估计 量 : 

(m -1)8: * (n; - DS 

= n, +n, -2 
利用 定理 6.11 和 定理 6.12, WEH: (n, +n, -2) 
So 是 自由 度 >=(m +n, -2) 的 xX 分 布 . 

-92 RY, MY, 分 别 是 大 小 为 由 fi n, 的 独立 随机 
样本 的 均值 ,两 个 样本 分 别 来 自 参数 (u, o?) 和 
(az, a^ ) 的 正 态 分 布 总 体 ， 如 果 

(n - St + (n, - DS 

n, +n, -2 


o 





S, 


eo 


$, 





证 明 ， _ 
r-% -Y,) - (uu -Ha ) 
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是 自由 度 为 v= (n, +n, -2) 的 学 生 氏 了 分 布 . 
快速 回顾 
重要 公式 
p(xly) =p(x,y)/p(y) 如 果 瑟 和 了 相关 
离散 随机 变量 的 条 件 概率 分 布 ; p(x) 如果 天 和 了 独立 
、 fly) 2f(x,y)/f(y). WR X M YHA 
连续 随机 变量 的 条 件 概率 分 布 : MEE 
E(c) =c 
Ec - g(X,Y)] 2e - E[g( X,Y)] 
mw. Elg (X,Y) +g, QGY)] 2 Eg; (X,Y)] +E[z; (XY) ] 
E(XY) -E(X) -E(Y) BR X # Y du 
Cov(X,Y) -E(XY) -E(X) - E(Y) tig X d YW% 
Bons: =0 An XO Y Rar 
Co (X, Y) inm xm Y 相关 
相关 系数 ， so 
=0 如 果 针 和 了 独立 
— XM. a _ (a -0.5) - np Z (5 *0.5) -np 
二 项 分 布 的 正 态 近似 : P(a<Y<b) =P{ A 2« E ] 
了 的 抽样 分 布 : 均值 =u, 标准 差 = on 
ZY 的 抽样 分 布 : 均值 = na, 标准 差 =Vno 
一 一 一 一 一 一 
符号 汇集 
CC 
# = 读 法 说 Hg 
p(xly) 给 定 y 时 x 的 p 给 定 Y 时 XX 的 条 件 概率 分 布 
flxly) AE y BF x 的/ 给 定 了 时 X 的 条 件 密度 函数 
Cov( X, Y) 协 方差 下 与 了 的 协 方差 
p rho X5 了 的 相关 系数 
x Yl mu 的 抽样 分 布 的 均值 


95 了 的 sigma 了 的 抽样 分 布 的 标准 差 
-一 一 


本 章 总 结 提示 


* 两 个 随机 变量 的 联合 概率 分 布 称 作 二 元 分 布 . 
。 给 定 了 后 , 随机 变量 X 的 条 件 概率 分 布 是 X 和 Y 的 联合 概率 分 布 除 以 了 的 边缘 概率 分 布 
° 于 与 了 的 协 方差 : Cov(X,Y) -E(XY) - E(X) - E(Y). 


e 工 与 了 的 相关 系数 : p =Cov(X,Y)/(0,0,). 
对 于 两 个 独立 的 随机 变量 ，(1) 联 合 概率 分 布 是 两 个 各 自 的 边缘 概率 分 布 的 乘积 ，(2)E(XY) = 


E(X)E(Y) ,(3) 协 方差 等 于 0, (4) 相 关系 数 等 于 0. 


° 统计 量 的 标准 误 是 抽样 分 布 的 标准 差 


统计 量 的 抽样 分 布 是 重复 抽样 时 这 个 统计 量 的 理论 概率 分 布 . 
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° 蒙特 卡 罗 模 拟 是 为 了 近似 抽样 分 布 而 重复 生成 一 个 统计 量 的 观测 . 
° 中 心 极限 定理 说 明 对 大 的 n, 了 的 抽样 分 布 近似 于 正 态 . 

° 了 的 抽样 分 布 的 两 条 性 质 ; 均值 =, 标准 差 o/m. 

° 当 j.+20 落 在 区 间 (0,n) 内, 正 态 分 布 可 用 于 近似 二 项 分 布 . 当 np>4 H nq>4 Bf, 这 个 结论 


° 与 正 态 分 布 有 关 的 一 些 抽样 分 布 : 卡 方 分 布 、 学 生 ( 氏 )7T 分布 和 玉 分 布 . 


是 正确 的 . 
补充 练习 
6.93 污染 的 鱼 类 . 参考 美国 陆军 工兵 部 队 保 存在 


DDT 文件 中 污染 鱼 的 数据 ( 见 第 1 章 和 第 2 章 活动 
中 的 统计 学 . ) 回顾 从 污染 的 亚 拉 巴 马 州 田 纳西 河 
中 捕 到 的 144 条 鱼 测 量 了 长 度 (cm) 、 重量 (g) 和 
DDT 水 平 ( 百 万 分 之 一 ). 


a. 


数据 分 析 表 明 鱼 的 长 度 分 布 是 左 偏 的 . 假设 鱼 
的 长 度 总 体 确 是 这 样 的 ， 总体 有 均值 = 4.3 
em, g =7 cm. 利用 这 些 信息 描述 从 田纳西 河 捕 
到 的 40 条 鱼 的 样本 的 平均 长 度 了 的 抽样 分 布 . 


.分析 表 明 鱼 的 重量 分 布 是 近似 正 态 的 . 假定 鱼 


的 重量 总 体 确 是 这 样 , 总体 有 均值 = 1.050 g, 
0 =376 g. 利用 这 些 信 息 描述 从 田纳西 河 捕 到 的 


40 条 鱼 的 样本 的 平均 重量 了 的 抽样 分 布 . 


.分析 表明 鱼 的 DDT 水 平分 布 高 度 右 偏 . 假定 鱼 


的 DDT 水 平 总 体 确 是 这 样 的 且 总 体 有 均值 y = 
24 ppm, o =98 ppm. 利用 这 些 信息 描述 从 田 纳 
西河 捕 到 的 40 条 鱼 的 样本 的 平均 DDT 水 平 了 
的 抽样 分 布 . 


6.94 决策 支持 系统 . 银行 管理 层 必须 决定 是 否 安 装 
商务 借贷 决策 支持 系统 (一 个 在 线 管理 信息 系统 ) 
以 帮助 分 析 师 作出 商务 借贷 决策 . 过 去 的 经 验 表 
H, 表示 归 因 于 决策 支持 系统 额外 增加 的 正确 借 
贷 决策 个 数 (每 年 ) 一 -接受 好 的 借贷 申 请 , 拒绝 
最 终 必 将 违约 的 申请 . 了 表示 决策 支持 系统 的 寿命 
(E), 两 个 变量 的 联合 概率 分 布 见 下 表 . 











a. 求 边缘 概 率 分 布 p,(x) M p(y). 


b. 


c. 


= 


e 


求 条 件 概 率 分 布 p, (x1y). 

已 知 决策 支持 系统 处 于 第 三 个 运行 年 . 求 做 出 
至 少 40 个 额外 正确 借贷 决策 的 概率 . 

求 决策 支持 系统 的 期 望 寿命 , 即 求 E(Y). 


- X MI Y EXU? X RU Y flr n? 
每 一 个 正确 借贷 决策 对 银行 利润 近似 地 贡献 


25 000 美元 . 计算 归 因 于 决策 支持 系统 的 额 
外 利润 均值 和 方差 . (提示 : 用 边缘 分 布 p 
(x). ) 


6.95 质量 控制 检查 员 . 假设 不 和 了 表示 两 名 质量 
控制 检查 员 在 S 工作 日 内 , 实际 花 在 执行 其 规定 
任务 的 时 间 比 例 , 有 联合 概率 密度 


e 


e 


x*y 如 果 0<x<l1; Oxy«l 


Kn wa 
求 边缘 概率 分 布 (4) 和 所 (7). 


- 验证 f(x)dx AT AOA = 1. 
求 条 件 概率 分 布 f(xly) 和 (ylx). 
. 验证 f(x1y)dx = 1 和 | £i x)dy = 1. 


- 下 和 了 相关 吗 ? 天 和 了 独立 吗 ? 
.对 两 个 参与 者 “ 非 生 产 " 时 间 ( 即 没 有 执行 规定 


任务 的 时 间 ) 的 比例 d 由 关系 式 D=1-(X+ 
了 /2 给 出 . 求 E(D) 和 V(D), 你 期 望 万 落 在 什 
么 范围 ? 


6.96 请 导 睡 眠 的 激素 ， 麻 省 理工 学 院 (MIT) 神 经 学 


二 元 概率 分 布 及 抽样 分 布 
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专家 研究 发 现 ,由 大 脑 中 的 松 果 腺 分 泌 的 褪 黑 激素 

有 诱导 睡眠 激素 的 功能 . 让 男性 志愿 者 服用 各 种 剂 

量 的 褪 黑 激 素 或 安慰 剂 ， 然后 在 中 午 让 他 们 进入 一 

个 黑 房间 里 ， 要求 他 们 闭 上 眼睛 睡觉 MIT 研究 者 

感 兴趣 的 是 每 一 个 志愿 者 人 睡 所 需 的 时 间 Xmin). 

研究 者 发 现 服用 安慰 剂 ( 即 没有 激素 ) 的 人 睡 平 均 时 

间 是 15 min. 假定 用 安奈 剂 治疗 , j=15, o =5. 

a. 考虑 20 个 服用 诱导 睡眠 激素 初 黑 激素 男性 随机 
样本 . 令 了 表示 这 个 样本 人 睡 的 平均 时 间 . 如 果 
激素 对 催眠 是 无 效 的 ,描述 Y 的 抽样 分 布 . 

b. 参考 a, R P(Y=6). 

c. 在 实际 研究 中 , 20 个 志愿 者 人 睡 的 平均 时 间 是 
了 =5. 利用 这 个 结论 给 出 服用 褪 黑 激素 的 真 
值 的 推断 . 

97 交通 路 线 的 合并 . 从 加 速 车 道 到 快车 道 并 道 过 

程 是 道路 立体 枢纽 中 交通 运行 的 重要 部 分 . 在 以 色 

列 一 项 平行 立体 枢纽 后 道 研究 表明 , 许多 驾驶 员 

并 没有 用 平行 道 的 全 部 长 度 进行 加 速 , 而 是 尽 可 

能 快 地 寻找 主要 交通 干道 合适 的 空隙 并 道 ( Trans- 

portation Engineering, 1985 年 12 H) xk TE dB Jg, 

54% 驾 驶 者 在 并 道 之 前 只 用 了 不 到 加 速 并 行车 道 

的 一 半 . 假设 在 雅 弗 尼 计 划 对 330 名 驾驶 员 的 随机 

样本 作 监 测 并 道 模式 . 

a. 在 并 道 前 少 于 100 名 驾驶 员 使 用 少 于 加 速 道 一 
半 长 度 的 近似 概率 是 多 少 ? 

b. 驾驶 员 中 有 多 于 200 个 使 用 少 于 加 速 车 道 一 半 

的 长 度 的 近似 概率 是 多 少 ? 
混凝土 的 蠕 变 . 在 负荷 下 首次 加 热 时 , 混凝土 

要 经 历 蠕 变 的 特征 显著 增加 , 试验 目的 是 研究 混 

凝 土 瞬间 热 应 变性 能 ( Magazine of Concrete Re- 

search, 1985. 12). 影响 热 应 变 的 两 个 变量 是 加 热 速 

BE. XC min) MARKE Z( 初 始 强度 的 百分比 ). 

准备 好 混凝土 样品 进行 检测 ， 以 确定 每 一 样品 在 

各 种 加 热 速度 和 负荷 组 合 下 的 热 应 变 . 设 产生 可 接 

受 结果 样品 的 ,了 的 联合 概率 分 布 如 下 表 所 给 出 

的 . 假定 混凝土 样品 是 从 那些 产生 可 接受 的 热 应 变 

性 能 试验 中 随机 抽取 的 . 














X( C Z/min) 
0.1 0.2 0.3 0.4 0.5 
0 0.17 0.11 0.07 0.05 0.05 
Y 10 0.10 0.06 0. 05 0.02 0.01 
20 0. 09 0.04 0. 03 0.01 0 
0. 08 0. 04 0.02 0 0 
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a. 求 混凝土 样品 加 热 速 度 为 3C/min 的 概率 . 

b. 已 知 混凝土 样品 加 热 速 度 为 3TC/min, 求 样品 负 
荷 为 20% 的 概率 . 

c 加 热 速度 天 与 负荷 水 平 了 相关 吗 ? 

d. 加热 速度 与 负荷 水 平 Y 了 独立 吗 ? 

99 ”家庭 暖气 用 油 的 需求 . 家 庭 暖气 用 油 的 供应 商 

有 一 个 250 加 仑 大 容器 , 在 每 周 开 始 时 注 满 . 由 于 

每 周 对 油 的 需求 平稳 增加 到 100 加 仑 后 稳定 在 

100 ~250 加 仑 之 间 , 每 周 的 需求 量 Y( 百 加 仑 ) 的 

概率 分 布 可 表示 为 : 


f(y) = 


如 果 供 应 商 的 利润 是 于 =107-2, R W HERE 
BE pa x. . 
DERAZ. £17 p ESAE 
亚 英 是 生产 除 劳 剂 , 例如 橙色 落叶 剂 的 副产品 . 科 
学 家 发 现 0. 000005 g( 百 万 分 之 五 ) 二 恶 英 ( 人 的 肉 
眼 几 乎 看 不 到 的 一 小 点 ) 对 于 试验 用 的 天 等 鼠 在 多 
于 一 半 的 动物 试验 中 是 致命 的 剂量 , 二 恶 英 的 毒 
性 是 马 钱 子 碱 ( 药 ) 的 2 000 倍 . 假设 杀 死 一 只 天 等 
鼠 所 需 的 二 恶 英 量具 有 均值 u = 0. 000005 g, 标准 
差 o =0. 000002 g 的 相对 频率 分 布 . 考虑 一 个 试验 ， 
在 此 试验 中 , 测量 毒 死 n =50 只 天 笠 鼠 中 每 只 所 需 
TERRE, 并 计算 样本 均值 了 
a. 计算 /好 和 oy. 
b. 求 杀 死 50 H X BA BTS — XESE BUE EJ BL < 
0. 0000053 g 的 概率 . 
MOLAR]. 森林 的 林 冠 郁 闭 度 百分率 确 
定 对 野生 生物 栖息 地 的 评价 、 流域 径流 估计 、 酸 
蚀 控 制 以 及 其 他 森林 管理 活动 是 至 关 重要 的 . 地 
球 科 学 家 估计 林 冠 郁 闭 度 百分率 的 一 种 方法 是 
通过 使 用 卫星 专题 制图 仪 卫星 监控 器 . EE ER] 
家 森林 (科罗拉多 ) 对 林 冠 郁 闭 度 百分率 进行 了 
研究 , 检测 由 飞机 在 各 处 森林 收集 到 的 专题 制 
图 仪 仿真 器 (TMS) 数据 (IEEE Transactions on Ge- 
oscience and Remote Sensing, 1986.1 ). 从 TMS 5 
频道 中 得 到 的 读数 均值 和 标准 差分 别 为 121. 74 
和 27. 52. 
a 设 了 是 32 个 森林 现场 样本 的 平均 TMS 读数 ， 
假设 所 给 的 数字 是 总 体 值 , 描述 了 的 抽样 分 布 . 
b. 用 a 中 的 抽样 分 布 求 了 落 在 118 ~ 130 之 间 的 
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概率 . 
102 林 冠 郁 闭 度 的 方差 . 参考 练习 6. 101. 设 S 
是 32 个 抽样 森林 现场 的 TMS 读数 方差 ,假设 样本 
来 自 正 态 总 体 , 估计 S 超过 1311 的 概率 . 
103 ”青蛙 的 超 冷 体温 . 栖息 在 陆地 表层 或 接近 陆 
地 表层 的 许多 种 陆 栖 青蛙 , 它们 能 够 在 长 期 暴露 于 
冬季 低温 下 生存 . 在 冰冻 的 条 件 下 , 青蛙 的 体温 称 
作 超 冷 体温 , 能 相对 地 保持 较 高 , 原因 在 于 体液 中 
甘油 的 积累 . 研究 表明 在 — 6C v BERT BRE TE EE DER 
冷 体温 有 均值 为 - 2. 18% , 标准 差 为 0.32 人 CC 的 相对 
频率 分 布 ，( Science,1983. 5. ) 考 虑 在 -6C WER n 
= 各 个 陆 柄 青蛙 随机 样本 的 平均 超 冷 体温 Y. 
a 求 了 超过 -2.05C 的 概率 
b. 求 了 落 在 -2.20d 5j -2. 10*C 之 间 的 概率 . 
104 At dE. 质量 控制 是 与 大 量 生产 产品 有 
关 的 一 个 问题 . 必须 监控 生产 过 程 以 保证 缺陷 品 率 
保持 在 一 个 可 接受 的 低 水 平 . 解决 这 个 问题 的 方法 
之 一 是 批 验 收 抽样 . 从 生产 的 产品 中 抽取 一 个 随机 
样本 , 并 对 样本 中 的 每 个 产品 仔细 检查 . 整 批 产 品 
被 接受 还 是 被 拒绝 是 基于 样本 中 观测 到 的 缺陷 品 
数 . 假设 袖珍 计算 器 制造 商 从 一 天 的 产品 中 随机 抽 
取 了 200 个 模压 电路 确定 样本 中 缺陷 品 数 Y. 如 果 
样本 的 缺陷 品 率 为 6% 或 更 低 是 可 以 接受 的 , 而 制 
造 商 不 知道 全 天 线路 产品 的 8% 是 缺陷 品 , 求 这 -- 
批 模压 电路 被 拒绝 的 近似 概率 . 
105 中 子 反 射 . 参考 练习 3. 36 描述 的 在 核 聚 变 反 
应 中 输送 中 子 问 题 . 回忆 粒子 释放 到 某 种 类 型 的 真 
空 管 并 与 管内 壁 碰撞 , 要 么 以 0. 16 的 概率 散射 ( 反 
射 ), 要 么 以 0. 84 的 概率 被 吸收 (Nuclear Science 
and Engineering, 1986.5). 假设 在 原子 反应 堆 中 
2 000 个 中 子 释放 到 未 知 类 型 的 输送 管 ， 其 中 280 
个 被 反射 . 如 果真 空 管 的 反射 概率 是 0. 16, 2 000 
个 中 子 中 有 280 个 或 少 于 280 个 中 子 反 射 离开 内 
管 壁 的 近似 概率 是 多 少 ? 
106 ”再 造 环 毛 复合 木材 的 强度 . 再 造 环 氧 复合 木 
材 切 块 试验 显示 , 并 行文 理 的 木屑 板 样品 粘 结 强 
度 的 概率 分 布 均值 为 1312 lbyin? , 标准 差 422 1b/ 
in^. (Journal of Structural Engineering, 1986.2). 假 
Wt 100 个 环 氧 复合 木材 样品 是 随机 选取 的 ,每 一 个 
粘 结 强度 是 确定 的 . 
a 描述 100 个 环 氧 复合 木材 样品 的 样本 平均 粘 结 
强度 了 的 抽样 分 布 . 
b. 计算 P(Y>1418). 
c. 如 果 计 算 的 实际 样本 均值 是 了 = 1 418, 你 对 切 


块 试验 的 结论 有 什么 推断 . 

d. 描述 有 100 个 环 氧 复合 木材 的 烙 结 强度 样本 方 
差 S° 的 抽样 分 布 , 假设 样本 来 自 正 态 分 布 . 

e. 估计 P(S > 500). 


. 107 铝板 上 的 疯 点 . 建筑 承包 商 决定 购买 一 堆 工 


广 废弃 的 铝板 ,只 要 工厂 废弃 样本 量 为 35 的 样本 
中 每 张 铝板 疣 点 的 平均 个 数 是 2. 1 或 更 少 . 假如 已 
知 工厂 废弃 的 铅 堆 中 , 每 块 馈 块 羔 点 的 个 数 是 均 
值 为 2.5 的 泊 松 概率 分 布 . 求 承 包 商 不 购买 这 批 铅 
板 的 近似 概率 , (提示 : 如 果 了 是 均值 为 的 泊 松 


分 布 , 那么 o3 = A. ) 


.108 机 器 维修 时 间 . 在 Industrial Engineering 


(1990.8) 上 的 一 篇 文章 由 模拟 研究 讨论 了 正确 建 

立 机 器 停工 时 间 模 型 的 重要 性 . 正如 说 明 的 那样 ， 

研究 者 考虑 用 参数 B = 60 的 指数 分 布 作为 单个 机 

器 系统 的 维修 时 间 模 型 . 感 兴趣 的 是 100 个 机 器 停 

工 样本 的 平均 维修 时 间 Y. 

a 求 E(Y) 和 了 的 方差 。 

b. 什么 样 的 概率 分 布 给 出 了 抽样 分 布 的 最 好 模 
型 ? 为 什么 ? . 

c. 计算 平均 修理 时 间 了 不 长 于 30 min 的 概率 . 


.109 部 十 顿 海滩 的 排泄 物 污染 . 加 利 福 尼 亚 州 授 


权 排 汇 物 指示 器 监测 所 有 公共 海滩 中 的 细菌 . 当 在 
单个 水 样 中 , 每 100 mL 排泄 物 的 细菌 浓度 超过 400 
个 成 形 菌落 时 ， 当地 卫生 官员 必须 给 出 告示 ( 称 作 
冲浪 区 域 告示 ) 警告 常 去 海滩 者 对 进入 水 中 的 潜在 
健康 风险 . 加 利 福 尼 亚 大 学 欧文 分 校 工 程 师 在 加 利 
福 尼 亚 州 的 享 丁 顿 海滩 做 了 一 项 关于 冲浪 水 质 的 
研究 ,并 在 Environmental Science & T. echnology ( 2004 
年 9 月 ) 报 告 了 此 结果 . 研究 人 员 发 现 尽管 在 某 些 
低 度 污染 情况 下 关闭 了 海滩 ， 但 其 他 地 方 排泄 物 
限制 超过 时 却 没有 发 布告 示 . 他 们 把 这 些 “ 冲浪 地 
域 告示 失误 ” 归 因 于 冲浪 地 水 的 自 然 变化 (例如 ， 
排泄 物 的 细菌 浓度 在 晚上 及 退潮 期 间 趋 势 比较 高 ) 
及 采集 水 样 与 发 布 或 撤销 告示 之 间 固有 时 间 延 误 . 
为 了 避免 发 布 失误 , 研究 人 员 推荐 用 平均 方法 而 
不 是 用 单个 样品 确定 不 安全 水 质 . (例如 ， 一 个 简 
单 的 平均 方法 是 取 多 个 水 样 的 随机 样本 ,并 比较 
排泄 物 细菌 水 平 的 平均 值 与 400cpu/100 mL 限制 ， 
以 确定 水 质 是 否 安 全 . ) 讨论 用 单个 样品 标准 相对 
于 平均 法 的 优 缺 点 . 讨论 的 部 分 内 容 应 包括 水 实际 
上 是 安 全 时 发 布告 示 的 概率 以 及 水 不 安全 时 发 布 
告示 的 概率 . (假设 享 丁 顿 海 滩 水 样品 的 排泄 物 细 
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菌 浓度 近似 服从 正 态 分 布 . ) 

6.110 直到 数据 处 理 装置 的 一 个 新 元 件 交付 等 待 时 
间 了 是 区 间 1~5 天 上 的 均匀 分 布 . 对 于 购买 者 这 
种 延迟 的 成 本 C( 百 美元 ) 由 C= (Y. +3) 给 出 , sË 
延迟 成 本 至 少 在 2 000 美元 的 概率 , 即 计 算 P(C> 
20). 


理论 练习 
6.111 设 X 和 了 Y 是 联合 密度 函数 为 f(x,y) 的 两 个 
连续 随机 变量 , 证 明 : 
flf) =f (x1y)f (y) 
6.112 设 X 和 Y 是 不 相关 的 随机 变量 , 验证 下 面 
各 式 : 
a V(X+Y) =V(X- Y). 
b. Cov[ (X & Y) , (X -Y)] =V(X) -V(Y). 
6.113 假设 三 个 连续 随机 变量 Y, Y. Y, 的 联合 
分 布 : 
fon ,73) 
_ c(y, +y, )e 3 TUR Ox y, <1;0<y,<2;y, 20 
-f 其 他 
a. OK c (Bf fy oy, y ) 为 一 个 概率 密度 . 
b 这 三 个 变量 独立 吗 ? (提示 : 如 果 (y, iy, y.) 
=ñ (>, M Gf (ys) ， 那么 Y,,Y, Wi Y, 独立. ) 
6.114 ”考虑 密度 函数 
3y AR sys 


f) 其 他 
R WW 的 密度 函数 . 其 中 ， 
a. W JY. 
b. W =3 - Y. 
c. W = -InY. 
6.115 Y, HY, 是 来 自 参数 a=1, 任意 8 的 密度 
PR82828: 


d onn ,>0(i=1,2 
fa «I WR y, 20(121,2) 
0 其 他 


工 随机 变量 的 ”=2 个 观测 值 的 样本 . 证 明和 
W-(Y, +Y,) 是 参数 为 w=2 和 有 的 T 随机 变量 . 
(提示 ; 可 以 利用 结论 

P(W < x) = P(0 < Y, =wu-VY,,0 < Y, <w) 


= ° Ky, ,ya ) dy, dy, 
|J, 


然后 利用 事实 
Ko x2) zf( y Mn) 
[NM Y, Y, 是 独立 的 . ) 


6.116 设 了 是 均值 为 B 的 指数 分 布 . WE : W -2Y/g 
是 自由 度 >=2 80 y^ 密度 . 

6.117 台式 计算 机 的 电子 元 件 寿命 Y 有 由 下 式 给 出 
的 瑞 利 密度 ， 


(e 如 果 y >0 


0 其 他 


RW = Y° 的 概率 密度 函数 并 判定 密度 函数 的 类 型 
提示 : 在 确定 丈 的 密度 函数 时 , 可 以 用 以 下 结果 


[Eeay = — eB 


Ky) -| 


6.118 EY, Fn Y, 是 来 自 均值 为 1 方差 为 0? iE dS 
分 布 的 n=2 个 观测 值 的 随机 样本 . 





a. 证 明 : 
RES: 
V2r 
有 标准 正 态 分 布 . 


b. EA a 的 结果 , 证 明 : Z? 具有 自由 度 为 1 yf 
分 布 . (提示 : 首先 证 明 S = (Y, - Y,)2⁄2; 然后 
应 用 定理 6.11. ) 
6.119 参考 练习 6. 54. 用 计算 机 产生 概率 密度 为 ， 
e? WR y «0 
A» -lo 其 他 
分 布 的 n= 100 个 观测 值 的 随机 样本 , 重复 运行 
1000 次 , 对 1000 个 样本 中 的 每 一 个 计算 大 小 为 
n=100 的 样本 均值 Y 然后 产生 (用 计算 机 ) 这 
1 000 个 样本 均值 的 相对 频率 直方 图 . 这 个 结果 与 
中 心 极限 定理 描述 的 理论 抽样 分 布 一 致 吗 ? 
6.120 ”利用 定理 6.7, 从 概率 密度 函数 为 
2(y-1) 如 果 1<y<2 
fo -= 其 他 
的 总 体 中 抽取 n =5 个 样本 观测 值 的 随机 样本 . 
6.121 ”利用 定理 6.7, 从 概率 密度 应 数 为 
_ [2ye^? 如 果 0 <y « co 
/ly) lo ^ 
的 总 体 中 抽取 n = 5 个 样本 观测 值 的 随机 样本 . 
6.122 ” 称 连续 随机 变量 了 具有 参数 为 & 和 的 对 数 
正 态 分 布 , 如 果 它 的 概率 密度 函数 y) WR. 
1 (lny - u)? 
ID = 站 el UU Cp o9 
HEB: X - ln(Y) EC 3S 4828 u, 方差 为 o? 的 正 态 
分 布 . 
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活动 中 的 统计 学 : Up/Down 维修 系统 的 可 用 性 

在 第 4 章 活动 中 的 统计 学 , 感 兴趣 的 是 “一 次 性 ”装置 或 系统 的 可 靠 性 . 一 次 性 系统 是 非 维修 系 
统 , 要 么 超过 “任务 ”时 间 生 存 下 来 达到 目的 , 要 么 在 完成 任务 之 前 毁坏 而 失败 . 与 此 不 同 , 维修 系统 
是 当 失效 时 , 能 够 修复 并 能 返回 操作 的 系统 . 维修 系统 的 可 靠 性 是 美国 国防 部 出 版 物 (START, Vol, 
11. 2004) 的 主题 . 出 版 物 对 于 维修 系统 的 宗旨 是 “帮助 工程 师 更 好 地 理解 用 于 性 能 度量 的 统计 方法 
的 意图 和 含义 ”. 

在 定期 系统 维修 中 , 系统 处 于 典型 的 “平息 ”, 即 系统 正 处 于 维修 而 不 能 使 用 . 因此 , 在 系统 维修 
H, 一 个 重要 的 概念 是 “可 用 性 ”. 由 定义 ,“ 循 环 可 用 性 "是 指 系统 在 维修 循环 期 间 的 任 一 时 间 点 正 
在 运行 的 概率 . 循环 可 用 性 4 可 以 表示 成 两 个 连续 随机 变量 的 函数 . 设 随 机 变量 X 表 示 系 统 失效 之 
间 的 时 间 , 随机 变量 了 表示 在 维修 循环 期 间 修理 系统 的 时 间 . 这 样 , X 表示 系统 的 高涨" 时间 ,了 表 
示 “ 低 落 ” 时 间 ,(X+ 了 ) 表 示 总 的 循环 时 间 . 那么 

A=X/(X+Y), X>0 R Y>0 

系统 维护 工程 师 的 目的 是 理解 可 用 性 A 的 性 质 . 这 包括 期 望 (平均 ) 可 用 性 和 可 用 性 的 第 10 百 分 位 
数 . 为 了 做 到 这 一 点 ,必须 求 出 可 用 性 的 概率 密度 函数 妃 c). 

作为 一 个 例子 , 国防 部 用 指数 分 布 (5.7 节 ) 对 失效 时 间 X 和 修理 时 间 Y 建 模 . 在 这 个 假定 下 , 可 
用 性 A 的 概率 分 布 是 什么 ? 国防 部 在 理论 上 (用 变换 的 方法 ) 和 用 蒙特 卡 罗 模 拟 导 出 了 这 个 分 布 . 变 
换 方 法 的 要 点 (详细 内 容 超 出 了 本 书 范围 ) 如 下 . 

假设 失效 时 间 关 是 均值 为 1 小 时 的 指数 分 布 , 修理 时 间 了 也 是 均值 为 1h 的 指数 分 布 , H X 5; Y 
是 独立 的 , 那么 

filx) =e *, x>0 
hly) =e, y»0 
H. gr X Y Ehr, 
f(x,y) =fi(x) * (y) =e Te? 2e (+ 

BSüfEA-2X/(X«Y), W B=(X+7 了 ), 则 通过 一 些 计算 可 以 证 明 X=A4.BHY=(1-4)，:B. 

为 了 求 4 的 密度 函数 g(a) , 首先 需要 求 4 A B 的 联合 概率 密度 函数 g(a, b). 这 个 密度 可 通过 
YE x 2ab fI y 2 (1—-a)/b RARER SC, y)， 再 乘 以 一 个 适当 的 导数 而 得 . (这 就 是 变换 法 ). 在 
前 面 的 假定 下 , 可 以 证 明 ( 证 明 略 ) 

g(a,b) =pe,0<w<1l1 和 8>0 
ADR gla), 15.4 节 中 说 明 的 那样 , 对 g(a, b) XT b 进行 积分 . 


g(a) = f, (0d - f, 5d — . 2[-e*-(-8)]21 


由 于 4 在 0 和 1 之 间 变 动 , 你 可 以 看 出 g(c) 就 是 0 和 1 之 间 均 匀 随 机 变量 的 概率 密度 函数 ， 

对 于 系统 的 理论 性 能 度量 , 现在 可 以 由 均匀 分 布 的 参数 得 到 . 例如 , 可 用 性 的 期 望 值 是 五 (4) = 
0.5, 方差 是 Var(A) =1/12 =0. 083. 第 10 百 分 位 数 , 使 得 P(A4<d) =0.1 的 a 值 是 a=0.1. 类 似 地 ， 
下 四 分 位 数 和 上 四 分 位 数 是 Q, =0.25 和 Q, =0. 75. 

国防 部 还 用 蒙特 卡 罗 模 拟 得 到 循环 可 用 性 的 分 布 . 由 指数 随机 发 生 屁 (独立 地 ) 得 到 了 n=5 000 
对 关 和 了 的 随机 值 ， 对 每 一 对 随机 值 计 算 4 = X (X + Y) 的 值 ， 完成 这 项 模拟 并 把 结果 保存 在 
AVAILEXP 文件 中 . 对 于 5 000 个 A 值 的 概括 统计 量 见 图 SIA6. 1 的 MINITAB 输出 . 由 此 输出 , 均值 、 
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方差 、 下 四 分 位 数 和 上 四 分 位 数 分 别 是 0. 503 .0. 084.0. 247 和 0. 753. 这 些 模拟 值 与 导出 的 理论 均匀 
分 布 非常 接近 . 


Descriptive Statistics: A 


Variable N Mean Variance Minimum Qi Median Q3 Maximum 
A 5000 0.50251 0.08418 0.000590 0.24749 0.50667 0.75266 0.99999 











图 SIA6. 1 利用 失效 时 间 和 修理 时 间 的 指数 分 布 模拟 可 用 性 的 MINITAB 概括 统计 量 . 


蒙特 卡 罗 法 对 于 不 能 用 指数 分 布 建 模 的 失效 时 间 与 修理 时 间 分 布 是 特别 有 用 的 . 工程 师 发 现 循环 可 用 
性 一 般 用 分 布 建 模 ( 见 5.9 35) , 其 中 参数 a 表示 失效 之 间 的 平均 时 间 (MTBF), 参数 8 表示 修理 的 平均 
时 间 (MTTR). 作为 一 个 更 实际 的 例子 , 国防 部 考虑 一 个 a = MTBF =500 h, 8 = MTTR =30 h 的 系统 . 

我 们 用 MINITAB 模拟 这 个 6 分 布 的 n=5 000 个 4 值 , 并 把 结果 保存 在 AVAILBETA 文件 中 , 图 
SIA6. 2 的 MINITAB 输出 给 出 了 这 5 000 个 A 值 的 直方 图 以 及 概括 统计 量 . 回顾 可 用 性 4 表示 系统 是 
“高 涨 ”和 可 用 的 概率 , 这 些 概 括 统 计量 给 出 了 这 个 系统 的 性 能 度量 . 例如 , 均值 0.943 是 指 这 个 系 
统 处 于 “高 涨 ”平均 是 94.3% 的 时 间 . 均值 加 上 或 减 去 2 个 标准 差 得 到 区 间 : 

0. 943 +2 V0.0000988 = 0. 943 + 0. 0199 = (0. 923 ,0. 963) 

这 样 ( 应 用 经 验 法 则 ) , KA 95% 的 循环 系统 处 于 “高 涨 ”的 概率 在 0.923 与 0.963 之 间 . 下 四 分 位 数 
值 0. 937 表示 只 有 25% 的 循环 系统 处 于 高涨” 的 概率 在 0.937 UF. 其 他 重要 的 性 能 度量 , 例如 ， 
第 10 百 分 位 数 和 P(A > 0. 95 ) 由 模拟 的 直方 图 容易 得 到 . 


N 1 | 
34 ， 
ol m il il iil Hif. 


0.909 0.918 0.927 0. 23^ 0.945 0.954 0.963 0.972 





Percent 














Descriptive Statistics: A 


Variable N Mean Variance Minimum Q1 Median Q3 Maximum 
à 5000 0.94339 0.0000988 0.90555 0.93705 0.94401 0.95026 0.97437 











图 SIA6.2 MINITAB 利用 MTBF =500 和 MTTR =30 的 B 分布 描 述 模拟 可 用 性 的 统计 量 


第 7 章 用 置信 区 间 估 计 


目标 解释 统计 估计 的 基本 概念 ; 介绍 一 些 估计 量 并 举例 说 明 这 些 方法 在 涉及 一 个 或 两 个 样本 
的 实际 抽样 问题 中 的 应 用 . 


7.1 点 估计 及 其 性 质 


推断 总 体 参数 有 两 种 方法 :估计 未 知 参数 值 或 者 对 参数 的 假设 值 进行 决策 . 例如 , 我 们 可 以 估计 
一 个 工业 机 器 人 完成 一 项 任务 的 平均 时 间 j, 或 者 判断 平均 时 间 j 是 否 超过 某 个 值 (如 3 min). 这 种 
作出 有 关 一 个 或 多 个 总 体 参数 决策 的 方法 称 作假 设 的 统计 检验 , 是 第 8 章 主要 讨论 的 内 容 . 这 一 章 
将 研究 估计 . 

假设 我 们 需要 估计 某 个 总 体 参 数 , 记 作 0. 例如 68 可 以 是 总 体 均 值 j、 总 体 方差 o2 或 者 先 自 总 体 
的 一 个 观察 小 于 或 等 于 a 的 概率 F(a). 点 估计 用 符号 0 表示 ( 即 在 参数 符号 的 上 面 加 个 “ A “表示 它 
的 估计 ), 是 说 明 如 何 利用 样本 观测 值 计算 一 个 数 (一 个 点 ) 作 为 6 的 估计 值 的 规则 或 公式 . 例如 , 设 
Yi» Yo» 77s Yn 是 随机 变量 了 的 = 个 观测 值 的 随机 样本 . 样本 均值 7 就 是 总 体 均值 ECY) =u 的 一 个 点 
fiir, Bl ui - y. 类 似 地 , 样本 方差 S? 是 o? 的 一 个 点 估计 , 即 22 = 82@. 

定义 7.1 点 估计 是 说 明 如 何 基于 包含 在 样本 中 的 观察 值 去 计算 数值 估计 值 的 规则 或 公式 . 
由 计算 得 到 的 数 称 作 点 估计 . 

另 一 种 估计 总 体 参数 0 值 的 方法 是 区 间 估 计 . 区 间 估 计 是 一 种 由 样本 数据 计算 两 个 点 的 规则 ， 
通常 表示 为 一 个 公式 , 目的 是 形成 一 个 以 很 高 的 置信 程度 包含 参数 9 的 区 间 | 例如 , 如果 我 们 估计 机 
器 人 完成 一 项 任务 的 平均 时 间 灵 在 2.7 ~3. 1 分 钟 之 间 , 那么 区 间 2.7 ~3.1 就 是 4 的 一 个 区 间 估 计 . 

定义 7.2 区间 估计 是 说 明 如 何 利 m 
用 样本 数据 计算 用 于 估计 总 体 参 数 的 区 间 的 | 
公式 . 

因为 点 估计 由 样本 计算 得 到 , 所 以 它 有 
抽样 分 布 . 点 估计 的 抽样 分 布 完全 描述 了 它 
的 性 质 . 例如 , 由 中 心 极限 定理 , 当 样 本 容 
量 大 (如 n>30) 时 , 样本 均值 的 抽样 分 布 近 


似 为 正 态 分 布 , 其 均值 为 w， 标准 差 为 ,5( 见 
图 7. 1). 由 图 可 见 , 样本 均值 了 等 可 能 地 落 
在 的 左右 ， 以 约 0. 95 的 概率 与 久 的 偏离 图 7.1 大 样本 下 样本 均值 的 抽样 分 布 
不 会 大 于 20; =20//n. 

图 7. 1 表明 估计 量 的 两 个 重要 性 质 . 首先 ， 我 们 希望 估计 量 的 抽样 分 布 是 以 被 估计 的 参数 为 中 








y 











OO 在 这 一 章 (以 及 本 书 的 其 余部 分 ), 我 们 简单 地 用 小 写字 母 (如 7 和 ) 表 示 随 机 变量 的 函数 和 函数 的 取 值 . 
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心 . 如 果 估计 量 的 抽样 分 布 的 均值 等 于 被 估计 参数 6, 则 这 个 估计 量 称 作 无 偏 的 ; 否则 ， 估 计量 称 
作 有 偏 的 . 样本 均值 是 总 体 均值 的 无 偏 估计 . 无 偏 和 有 偏 估计 量 的 抽样 分 布 分 别 见 图 7.2a 和 
图 7. 2b. 








KA) KB) 
A B 
0 0 HB 
HA —— 
偏差 
a) 估计 量 4 是 无 偏 的 b) 估计 量 p 是 有 偏 的 


图 7.2 9 的 无 偏 和 有 偏 估计 的 抽样 分 布 


定义 7.3 如果 有 (6) =0, 称 参数 9 的 估计 量 6 是 无 偏 的 ; 如 果 EC) 6, 估计 量 称 为 有 偏 的 . 
定义 7.4 ”估计 量 9 的 偏 b(0) 等 于 6 的 抽样 分 布 的 均值 EE( 闪 与 9 的 差 ， 即 
b(0) -E(8) -8 

除了 无 偏 性 ,我 们 还 希望 估计 量 的 抽样 分 布 具有 最 小 方差 即 我 们 希望 抽样 分 布 的 离散 程度 尽 
可 能 小 , 使 估计 值 趋 于 落 在 0 附近 . 

图 7 3 描述 了 两 个 无 偏 估计 量 4 和 B 的 抽样 分 布 , 4 比 B 的 方差 小 . 在 所 有 无 偏 估计 中 方差 最 
小 的 无 偏 估计 称 作 最 小 方差 无 偏 估计 (MVUE). 例如 ,了 是 所 的 MVUE, BJ Var( y) = o2/n Eu 的 所 有 
无 偏 估 计量 中 方差 最 小 的 (证 明 略 ). 

定义 7.5 参数 9 的 最 小 方差 无 偏 估计 (MVUE), 是 所 有 无 偏 估计 中 方差 最 小 的 信和 计 入 

有 时 对 同一 个 估计 量 , 不 能 同时 达到 无 偏 性 和 最 小 方差 . 例如 , 图 7.4 显示 的 一 个 比 最 小 方差 无 
偏 信 计 B 的 方差 略 小 的 有 偏 估计 4. 在 这 种 情况 下 , 选用 使 均 方 误差 最 小 的 估计 量 均 方 误差 是 指 6 
与 9 间 偏 差 平 方 的 平均 ,6 的 均 方 误差 为 ET (6 - 9)?]. 


KA) 


KB) 








Ha 0 


HB ` HB 
图 7.3 具有 不 同方 差 的 0 的 两 个 无 偏 估计 量 图 7.4 有 偏 估 计量 4 和 MVUEB 
的 抽样 分 布 的 抽样 分 布 
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可 以 证 明 ( 证 明 略 ) ; 
E[(0-0)2] = V(0) «9 (0) 
因此 , 如 果 6 是 无 偏 的 , 即 如 果 (0) -0, 那么 均 方 误差 就 等 于 V(0). 进一步 , HR CO) =0 时 , 最 


小 均 方 误差 估计 9 就 是 9 的 最 小 方差 无 偏 估 计 . 
Wy yy oos ya EBED u, 方差 为 o? 的 随机 变量 了 的 nn 个 观测 值 的 随机 样本 . 证 明 ， 


样本 方差 ?是 总 体 方差 o? 的 一 个 无 偏 估计 , 其 中 
a. 被 抽样 总 体 为 正 态 分 布 . 
b. 被 抽样 总 体 分 布 未 知 . 
BE a 由 定理 6. 11， 当 样本 来 自 正 态 分 布 时 ， 
(n-1)s$  , 


=x 
c 


Hop y? 是 自由 度 为 >= (n -1) 的 卡 方 随机 变量 . 整理 得 
2 
2 C 2 


` ` Gn - 1 


由 此 得 


E(s?) = =E| ox CST. ?| 


应 用 定理 5.2, 我 们 有 





2 
= 
E(s?) S- DE) 
H 5.7 节 , RAE EQ) =v R. VO?) 22»; 因此 ， 
E(s?) = 





2 2 
m ape) =o? 
所 以 由 定义 7.3, 我 们 得 到 S? 是 o? 的 一 个 无 偏 估计 . 

b. 由 样本 方差 的 定义 , 我 们 有 
(Ey)? 


1 n 
s = a-pl x5 PM A ^al E n0] 
由 定理 4.4, o? - E(Y?) -jy ,所 以 对 于 随机 变量 Y, E(Y2) = o2 tu^. 又 因为 每 个 了 值 C7 , ys, e, 


Y.) BJ PIRE Jg u, 75325879 o2 的 总 体 中 随机 选取 的 , 所 以 有 
E(y2) 2g? +w’ (i=l, 2, =, n) 





和 
E(y1) =o + (p15) =0°/n +p 
求 * 的 期 望 值 , 并 将 上 式 代入 , 就 得 到 


EGD = ELE - 0921] {BL X l- Ebo] 











"iub aste cS o (aun) 


n-1 
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-t [ (no? + nu?) - o6? - np] = 


n-1l 








1 2 22] l2(n-lio.,2 
catene (eye = 


这 就 证 明 不 管 被 抽样 总 体 的 性 质 如 何 , s? 都 是 o? 的 一 个 无 偏 估计 . 


理论 练习 

7.1 BN, y, y 是 一 个 来 自 均 值 为 6 的 指数 分 布 
的 随机 样本 , BB E(y,)) =0, i=1, 2,3. 考虑 9 的 3 
个 估计 量 : 

ô; =y ó, =y 6, DUR 
a. 证明: 3x 3 个 估计 量 都 是 无 偏 的 . 
b. 哪 一 个 估计 量 有 最 小 的 方差 ? (提示: 回顾 指数 
分 布 有 V(y;) 26.) 

7.2 BY, y, s y, 是 一 个 来 自 均值 为 A 的 泊 松 
分 布 的 随机 样本 , BIEC) =A, i=1, 2, =, n 考 
R a 的 4 个 估计 量 : 


Al = y À, =n(y, +y, o +y,) 
2 Aty + y 


a 这 4 个 估计 量 中 哪些 是 无 偏 的 ? 
b. 对 于 无 偏 估计 量 ， 哪 一 个 有 最 小 的 方差? 
(提示 : 对 于 泊 松 分 布 , V(y,) =A. ) 
7.3 ”假设 随机 变量 了 有 参数 为 上 RU p 的 二 项 分 布 . 
a 证 明 ; pb = yn JE p 的 一 个 无 偏 估计 . 


7.2 求 点 估计 : 经 典 估计 方法 


b. RRDA. 
7.4 Wy,» c, y, 是 来 自 参数 a=2 和 8p 未 知 的 

T 分 布 的 随机 样本 . 

a. 证 明 :了 是 8 的 有 偏 估计 . 计算 偏 . 

b. 证 明 : 6=7/2 是 6 的 无 偏 估计 . 


c 求 B = 7/2 的 方差 . (提示 : 回顾 下 分布 有 
E(y;) =28 H V(y;) -2g. ) 

7.5 WEW: EL(6-0)*] = V(8) «P (8) , 其 中 仿 
b(0) =E(0) -0 (R; (6-0) -LÓ-E(8)] + 
[E(0) - 0]. ) 

7.6 iy 是 一 个 来 自 [2, 8] 上 均匀 分 布 的 容量 为 1 
的 样本 . 

a. 证 明 : y, 是 9 的 有 偏 估 计 并 计算 偏 . 
b. 证 明 : 2(y, -1) 是 9 的 一 个 无 偏 估计 . 
c. X2, -1) 897; 35. 

7.7 dy, yx, s Ya dé EL BD yu, 方差 为 o 
的 正 态 分 布 的 随机 样本 . 证 明 ; 2 的 抽样 分 布 的 方 
E 2o*/ (n-1). 


求 参数 的 点 估计 有 许多 不 同 的 方法 , 其 中 两 个 经 典 的 方法 是 矩 法 和 极 大 似 然 法 ， 这 两 种 方法 是 
本 节 的 重点 内 容 . 总 体 参 数 的 这 些 估计 方法 将 在 7.4 ~7. 10 节 介绍 ， 求 点 估计 的 其 他 方法 的 简要 介 
绍 将 在 本 章 最 后 给 出 , 其 余 两 种 方法 是 7. 12 节 的 内 容 . 


ABE 


到 目前 为 止 , 我 们 所 用 的 估计 方法 是 利用 样本 的 数值 描述 性 度量 去 估计 它们 的 总 体 参数 . 例如 ， 
我 们 用 样本 均值 了 估计 总 体 均 值 j. 由 定义 4.7 知 , 参数 E(y) =u 是 一 阶 原 点 矩 ， 有 时 称 作 一 阶 总 体 
5g. 类 似 地 , EL MEKE 


Yi 


HEREA E BRE D KE 075 s n MAR Ts. 对 本 章 所 讨论 的 参数 来 说 , 矩 法 得 到 的 估计 量具 有 前 
面 所 讲 的 两 个 性 质 , 即 无 偏 估 计 和 最 小 方差 估计 . 

定义 7.6 BN, Y2, y. 是 具有 某 种 概率 分 布 ( 离散 或 连续 ) 随 机 变量 了 的 于 个 观测 值 的 随 
机 样本 ,无 阶 总 体 矩 和 天 阶 样本 和 矩 定义 如 下 

k Br RARE: E(Y*) 





y = 


95 
RC 
Y 
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k 





E BERE AE m, = I 
3 k=1 时 , -m ŽE E(Y) =u, n — BH RAE3CX m, = y. 

X 7.7 BN, y, U, Yn 表示 参数 为 01,90,，-…, 0, 的 概率 分 布 (离散 型 或 连续 型 ) 的 随机 
变量 了 的 nn 个 观测 值 的 随机 样本 . 那么 矩 估 计 01, 05, oe, 0LCTVLIB tdk 3 m FPE AE E 4-8 5 60 
4j m Br É k 3E ; 

1 
E(Y) =—Xyi 


E(P) =+} 


E) - yy 
AP RAE 01, 05, 0, Op COE m RREZ 01, 05, n, 0, 的 函数 . ) 
注 : 对 m=1 的 特殊 情况 ,9 638 4533 2 W R MA HEAR. 
猫 的 听觉 神经 纤维 反应 速度 了 近似 服从 未 知 参 数 A BU TELE 2t (Journal of the Acoustical 
Society of America, 1986. 2). 假设 随机 抽取 了 10 只 猫 , 测 得 它们 的 听觉 神 经 纤维 反应 速度 ( 记 为 噪声 
爆发 的 每 200 ms 的 脉冲 个 数 ) 数 据 如 下 : 


15.1 14.6 12.0 19.2 16.1 15.5 11.3 18.7 17.1 17.2 


用 矩 法 计算 平均 反应 速度 A 的 点 估计 值 . 
解 ” 我 们 只 有 一 个 参数 A 需要 估计 , 因此 , 通过 令 一 阶 总 体 矩 FE(Y) 等 于 一 阶 样本 和 矩 了 就 可 以 求 
得 矩 估 计 . 对 于 泊 松 分 布 , ECY) =A, 因此 , 矩 估 计 是 ; 


A =》 








对 这 个 例子 
y= 215.68 

因此 , 估计 的 听觉 神经 纤维 平均 反应 速度 是 15. 68 脉冲 /200 ms. 
BEEJ ”地 下 电弧 从 疲劳 裂缝 到 失效 的 时 间 Y 近 似 服从 参数 为 a RB 的 分 布 (IEEE Transactions 
on Energy Conversion, 1986.3). 设 y1 ,ys，…, y, 是 随机 变量 了 的 个 观测 值 的 随机 样本 , R a Mg 
的 矩 估计 -. 

B ”因为 需要 估计 两 个 参数 oa RB, 和 挫 估 计 法 要 求 令 前 两 阶 总 体 矩 等 于 它们 相应 的 样本 和 矩 . 由 
5.6 节 知 , 对 工分 布 有 ; 





u= E(Y) - of 
o? = off 
再 由 定理 4.4, o? -ECY?) -u?. 因此 , EY) «o? +u. 所 以 工分 布 的 前 两 阶 总 体 矩 是 ， 
E(Y) =o8 


E(Y) =o? «4? = aff + (ag)? 
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令 这 些 等 于 它们 各 自 的 样本 矩 ， 我 们 有 











aB-y 
2 
在 第 2 个 等 式 中 用 了 代替 66， 就 得 到 
^ 2 
76+ Gyr 228 
或 
y> (Ey)? 
B= P gp EO 5 7n _(n-1)s 
n n n n 
两 个 等 式 化 简 为 : 
aß =F 
»B- Pa 


解 上 面 两 个 等 式 ， 得 到 矩 估计 ; | _ _ 
8-( s y a= (LC 
极 大 似 然 法 


极 大 似 然 法 和 关于 极 大 似 然 估 计 性 质 的 阐述 是 费 希 尔 ( Ronald A. Fisher, 1890—1962 ) 的 研究 结 
AR. 费 希 尔 的 思想 通过 下 面 的 例子 说 明 ， 如 果 随 机 选取 离散 随机 变量 了 的 个 观察 值 y, y, e, Yi, 
如 果 概率 分 布 p(y) 是 单个 参数 9 的 函数 , 那么 观测 到 了 的 这 个 独立 值 的 概率 是 : 

POL, Ya, cn Y) 2 pp) ply) 

费 希 尔 称 样本 值 Y. yo. y, 的 联合 概率 为 样本 的 似 然 函 数 工 , 并 建议 应 该 选择 使 / 达到 最 大 
的 值 作为 0 的 估计 值 . 如 果 样 本 的 似 然 函 数 工 是 两 个 参数 0, 和 的 函数 , 那么 9 和 0, 的 极 大 似 然 
估计 是 使 二 达到 最 大 的 那个 值 . 这 个 概念 可 以 推广 到 似 然 本 数 是 多 个 参数 的 函数 的 情形 . 

定义 7.8 a 5Y,Y,.., 了 是 离散 随机 变量 时 , n ARE y, yo, e, y, 的 样本 似 然 函数 
L KG RUE p(yi, ys, …，, Yn). 

b BY, Ya, o, Y, 是 连续 随机 变量 时 ，n AUR y y), y, 0 PE ARAS ES 84 L. ARAS 
BRE fy, ys, rs Ya). 

注 : Ey, ys s y 的 固定 值 ,上 是 9 的 函数 . 

定理 7.1 是 独立 性 定义 和 定义 6.8、 定义 6.9 的 直接 推论 . 

定理 7.1 a Gy, yz, >, Y. 表示 随机 变量 了 的 六 个 观测 值 的 样本 ， 当 了 是 概率 分 布 为 
P(Y) 离 散 随机 变量 时 , L=p(y1)p(y2)… pO). 

b. iyi. y2, …, Yi 表示 随机 变量 了 的 个 观测 值 的 样本 ， 当 了 是 密度 澡 数 为 1(y) 的 连续 随机 
ZER, LA DSO) f(y,). 

定义 7.9 设 L 是 一 个 样本 的 似 然 函数 ， 其 中 上 是 参数 91 ,0,，…， 0, 的 函数 ， 则 6 ,9,，…, 0, 
的 极 大 似 然 估计 是 使 得 [达到 最 大 的 0, 0, =, O, 的 值 . 

费 希 尔 证 明 总 体 均值 和 比率 的 极 大 似 然 估计 具有 某 些 非常 优良 的 性 质 . 随 着 样本 容量 n 越 来 越 
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K, 极 大 似 然 估计 6 的 抽样 分 布 越 来 越 接近 于 正 态 , 其 均值 是 0, 方差 小 于 等 于 任何 其 他 估计 量 的 方 
差 . 尽管 极 大 似 然 估计 的 这 些 性 质 只 适合 基于 大 样本 的 估计 量 , 但 它们 为 极 大 似 然 估计 提供 了 支持 
小 样本 情况 下 的 极 大 似 然 估计 性 质 可 以 用 第 4 章 、 第 5 章 和 第 6 章 的 方法 得 到 , 并 导出 它们 的 抽样 
分 布 , 或 者 至 少 可 以 得 到 它们 的 均值 和 方差 

为 了 简单 说 明 如 何 求 参数 的 极 大 似 然 估计 ,我 们 假设 是 单个 参数 o 的 函数 , 那么 由 微分 学 
我 们 知道 使 达到 最 大 (或 最 小 ) 的 0 值 是 使 dL/dg =0 的 值 . 求 它 的 解 (通常 使 二 达到 最 大 (证 明 
略 ) ) 可 能 是 困难 的 ,因为 了 是 一 些 含有 9 的 量 的 乘积 . 求 一 个 和 的 导数 要 比 求 一 个 积 的 导数 容易 些 ， 
所 以 我 们 企图 使 工 的 对 数 而 不 是 工 达 到 极 大 , 因为 工 的 对 数 是 二 的 单调 增 函 数 ,所 以 上 和 上 的 对 数 
在 同样 的 0 值 处 达到 极 大 . 在 例 7.4 和 例 7. 5 将 说 明 解 题 步 又 
Ë yr, yz, U, Yn 表示 随机 变量 了 的 个 观测 值 的 随机 样本 , 具有 指数 密度 函数 ， 











e 7/8 = 0 
e 7B PEN 
r=] p "9s 
0 其 他 
求 8 的 极 大 似 然 估 计 . 
解 因为 Yis 25 775, Yn 是 独立 的 随机 变量 ， 我 们 有 
- ... MIELE NE RD 
L = fy MG3) f, -( 3 y 5 EI 3 )= 
取 工 的 自然 对 数 得 
n Yi 
In(L) = In(e Ze) -nn(B) =- ST -nin() 
那么 
dln(L) _ > y, _ 
dB B B 
令 这 个 导数 为 0, RRA, 得 到 
2s 





这 就 推出 





因此 , 8 的 极 大 似 然 估 计 (MLE) 是 样本 均值 了 7, BUB = y. 
BEVI, Yas cos y, 是 随机 变量 了 的 ”个 观测 值 随机 样本 , 这 里 f(y) 是 均值 为 及, 方差 为 
o^ 的 正 态 密度 函数 , R u M o? 的 极 大 似 然 估 计 . 

解 BD yi ys,…, y. 是 独立 的 随机 变量 , 我 们 有 
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e O1 (262), (e 02/07) e O0 / Qe) 
SAO fix o A 


o 427 O 4/2 


e Xni Qs) 











a^ (2n)"? 
K 
之 (OA ,. MEM 
In(Z) =- 2j - z Po ) - > In(27) 
XFIn(L) ET u A o? 求 偏 导数 , 并 令 它们 等 于 0, 得 到 
ñ 2 
TO 2,205 - i PES 
p. 2g? 
和 
aln(L) _ AA afo _ 
ðo? 26 2\02 


使 L( 因 此 使 In(L) ) 达 到 最 大 的 jw 和 oo? 是 上 面 两 个 方程 的 联 立 解 . 由 第 一 个 方程 得 
Z O-A) =0 或 yi -np=0 
由 它 得 到 
ng = 25 Ë u-y 


将 4=7 了 代入 第 二 个 方程 , 并 且 两 边 同 乘 以 2 6? ,得 到 


2 (y; - y)2 >. (y; - y)2 
izi - =n g -= 与 
o? n 


因此 , u 和 o? 的 极 大 似 然 估计 是 : 


注意 , o? 的 极 大 似 然 估计 是 离 差 平方 和 > Gr; - 30? BREL n, 但 样本 方差 用 nn-1 ËR. 在 例 
7.1 证 明了 s? d a? 的 一 个 无 偏 估计 . 因此 , 极 大 似 然 估计 


2. 20i» -D 


n n 





X o? 的 有 偏 估计 . 
最 小 二 乘法 
男 一 个 求 点 估计 的 方法 是 最 小 二 乘法 ,这 个 方法 通过 使 均 方 误差 (MSE) 


^ AR 
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MSE = E[ (8— 0)?] 
达到 最 小 来 求 9 的 估计 . 最 小 二 乘法 (一 个 广泛 应 用 的 估计 方法 ) 将 在 第 10 章 详 细 讨 论 . 这 里 简要 说 
明 几 个 其 他 的 估计 方法 ; 如 果 想 学 习 更 多 关于 它们 的 应 用 ， 请 查阅 本 章 后 面 的 参考 文献 . 
刀 切 估计 
图 基 ( Tukey, 1958) 提 出 了 “每 次 于 下 一 个 "来 获得 估计 的 方法 ， 叫做 刀 切 法 2 ,这 种 方法 在 实际 
应 用 工作 者 中 得 到 了 越 来 越 广泛 的 接受 . dE, y, o, Y, 古 取 自 有 参数 0 的 总 体 , 一 个 容量 为 n 的 


样本 .去 掉 第 i 个 观测 值 ( 即 y;), 依据 剩 下 的 mn- 1 个 观测 值 计算 估计 值 0,5. 对 数据 集 的 每 个 观测 


值 执行 一 次 这 种 计算 , 共 得 到 9 的 n 个 估计 值 6(1) ,6(2) ，…， e. 0 的 刀 切 估计 是 这 个 估计 信和 合 
理 选 择 的 线性 组 合 ( 即 它们 的 加 权 平均 ). 当 有 异常 值 或 对 有 偏 的 样本 ,或 发 现 很 难 评价 比较 传统 仁 
计 方法 的 变异 性 时 ,建议 用 刀 切 法 估计 . 

稳健 估计 

7.4 77, 10 节 串 将 要 讨论 的 许多 估计 方法 都 假设 抽样 总 体 是 近似 正 态 的 . 当 抽样 总 体 的 分 布 与 
正 态 性 有 较 大 偏离 时 ,这 些 估计 量 不 再 具有 优良 性 质 (如 无 偏 性 和 最 小 方差 性 )， -种 适用 于 大 部 分 
慨 率 分 布 的 方法 叫做 稳健 估计 . 例如 ,一 种 叫做 M 估计 的 总 体 均值 的 稳健 估计 ， 当 抽样 总 体 是 正 
态 分 布 时 ; 它 不 亚 于 样本 均值 7; 当 抽样 总 体 是 厚 尾 或 有 偏 斜 时 ， 它 要 比 了 好 得 多 .由 “自助 "法 导出 
的 稳健 估计 类 型 将 在 7. 12 节 讨论 . 关于 稳健 估计 方法 的 更 深入 讨论 ,参看 Mosteller 和 Tuker(1977) 
及 Devore(1987 ) 的 文章 

贝 叶 斯 估计 

经 典 信 计 方法 都 是 基于 未 知 参数 9 是 常数 的 概念 ,我们 得 到 的 所 有 关于 0 的 信息 都 来 自 相关 总 
体 的 随机 样本 yi, y>, csv. 与 此 不 同 ， 贝 叶 斯 估计 认为 参数 0 是 具有 某 个 已 知 的 先 验 概率 分 和 
8(6) 的 随机 变量 . 样本 信息 用 于 修正 0 的 先 验 分 布 ， 从 而 得 到 后 验 分 布 /9 y, y. y,). 9 的 贝 
中 斯 估计 就 是 后 验 概率 分 布 的 均值 [参看 Mendenhall, Wackerly, RI Scheatfer( 1989) 1. 关于 贝 叶 斯 估 
计 的 简要 讨论 见 7. 12 节 . 


理论 练习 7.9 BEY, yas e, yn 是 来 自 概率 函数 为 
7.8 二 项 试验 由 x 个 伯 努 利 观测 值 y, =, y, p(y) CA (y=0, 1,2, +.) 
构成 ,其 中 泊 松 分 布 的 = 个 观测 值 的 样本 . 
f! 如 果 第 ;次 试验 成 功 a. OR À 的 极 大 似 然 估 计 
”Lo 如 果 不 成 功 b， 这 个 极 大 似 然 估计 是 无 偏 的 吗 ? 


7.10 Wy, y, y, 是 随机 变量 7 的 n 个 观测 值 的 


并 且 P(y; 21) =p, P(y; =0) =1-p. $ Y= 25 随机 样本 , 这 里 fy) 是 a =2, B 未 知 的 T 密度 函数 


表示 n 次 试验 中 成 功 次 数 . 


e YB 
a R p 的 矩 估计 fo) [6 如 果 y>0 
b. 这 个 矩 估计 是 无 偏 的 吗 ? 0 其 他 
e. R p 的 极 大 似 然 估计 (提示: L=p (1 - p)*7.) a 求 B 的 极 大 似 然 佑 计 . 
d 这 个 极 大 似 然 估计 是 无 仿 的 吗 ? b. R ECB) VCB). 





O ”这 种 方法 的 名 字 取 自 于 男 童子 军 牌 折 刀 ; 像 折 刀 一 样 ， 在 专门 方法 不 能 使 用 时 ， 这 种 方法 在 许多 情况 下 是 -个 便利 的 工具 
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7. 11 参考 练习 7. 10. " le 如 果 y>0 
a. y ss] i. y -| 
M ja d) 0 其 他 
b. K E(B p). 
7.12 ity, y, …, y, 是 来 自 期 望 为 0, JEP 未 s pam HARRUA 
知 的 正 态 分 布 的 = 个 观测 值 的 随机 样本 . R o° 的 MA tit. 
1 iu 
极 大 似 然 估计 . b， 这 个 矩 估 计 是 无 偏 的 吗 ? 


7.18 By, y, Ul, y, 是 来 自 密度 函数 为 c. 求 V(B). 


7.3 求 区 间 估 计 : 枢 轴 法 


7.1 节 给 出 了 区 间 估 计 的 定义 ,就 是 告诉 我 们 如 何 利用 样本 观测 值 计 算 两 个 数 , 由 此 确定 一 个 
以 很 大 的 置信 程度 包含 被 估计 参数 的 一 个 规则 . 所 得 的 随机 区 间 ( 随 机 是 因为 用 于 计算 区 间 端 点 的 
样本 观测 值 是 随机 变量 ) 称 作 置信 区 间 , 包含 被 估 参 数 的 概率 (抽样 前 ) 称 作 置 信 系 数 . RARE 
信 区 间 的 置信 系数 是 0. 95 ,就 称 它 是 95% 的 置信 区 间 . 如 果 置 信 系 数 是 0. 99， 就 称 它 是 99 多 的 置信 
KE, 等 等 . 在 本 节 的 稍 后 将 给 出 关于 置信 区 间 的 置信 系数 的 更 实际 解释 . 

定义 7. 10 一 个 置信 区 间 的 置信 系数 等 于 在 抽样 前 随机 区 间 包 含 被 估 参 数 的 概率 

一 种 求 参 数 9 的 置信 区 间 方 法 是 求 出 一 个 枢 轴 统计 量 , 这 个 统计 量 是 样本 值 和 单个 参数 9 的 函 
数 . 因为 当 样 本 容量 n 很 大 时 , 很 多 统计 量 近似 正 态 分 布 (中心 极限 定理 ) ,所 以 可 以 利用 标准 正 态 
随机 变量 Z 作为 枢 轴 统 计量 来 构造 期 望 值 的 置信 区 间 . 

为 了 说 明 这 个 问题 , 令 9 是 大 样本 下 抽样 分 布 jz) 
为 近似 正 态 分 布 的 统计 量 , WAX ECG) = 0, 标准 
RA o5, 那么 
0-0 
Un 
是 标准 正 态 随机 变量 , 因为 Z 也 是 样本 统计 量 6 
和 参数 9 的 函数 , 所 以 把 它 作 为 一 个 枢 轴 统 计量 . 0 
为 了 导出 9 的 置信 区 间 , 首先 给 出 枢 轴 统 计量 概率 fen fa 
表示 , 为 此 将 值 xz 和 -zan WE Z 分布 每 个 尾部 图 7.5 置信 区 间 的 s, it 
2 MRT S TWEN, 

P( -z,5&Zzz,5) 21- 


将 Z 的 表达 式 代 和 人 上面 的 概率 表示 ， 并 对 此 不 等 式 进 行 简单 的 代数 运算 ， 就 得 到 


Z= 











0-0 ^ 
P( -zan EZ Sza) =P( “Zan < =P 2) -P(-z2,50$&0-0sz, 50$) 
| 0$ 


^ 


= P( -8-z,50$* -0s -0*z,50$) 
-P(0-z,505050*z,50$) z]- 


因此 , 由 LCL=b- 2,5058] UCL = 6 +z pe; 形成 的 区 间 包 含 参数 9 的 概率 等 于 1 -a MLA 
UCL 分 别称 作 置 信 区 间 的 置信 下 限 和 置信 上 限 . 这 个 区 间 的 置信 系数 是 (1 — o). 
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关于 参数 0 的 大 样本 (1 - a) 10096 置信 区 间 的 推导 总 结 为 下 面 的 定理 7. 2. 

定理 7.2 设 0 在 大 样本 下 服从 EE(9) =0, 标准 误 为 ap 的 正 态 分 布 . 那么 9 的 (1 一 a)100% 置 
信 区 间 是 : 

0+ (zan) og 

图 7. 6 直观 地 显示 了 大 样本 的 置信 区 间 . 相应 于 面积 4 =0. 475 的 z 值 , 即 z 值 落 在 面积 为 w2 = 
0.025 的 Z 分 布 上 尾 ( 见 表 B.5) 为 zoo = fO) 
1.96. 因此 , 9 落 在 6 的 1.960s 范 围 内 的 概率 
是 0.95, 这 可 以 由 图 7.6 看 到 , 只 要 9 落 在 区 
[8] 6 € 1.9605 P3 , 那么 区 间 9+1.960s 就 包含 
0, 因此 9+1.960 ¿8 E: 0 BJ) 95% RS bc lal. 

实际 求解 置信 区 间 时 ， 有 可 能 会 遇 到 一 
些小 困难 . cb 通常 是 待 估 参 数 9 的 函数 , 但 是 


近似 0.95 

















=ĝ 


当 样 本 容量 ”很 大 时 (在 推导 时 始终 假定 ! ñ | 
的 ) , 我 们 可 以 用 估计 值 6 代替 参 数 0 得 到 0 m T qr 
的 近似 值 . 图 7.6 大 样本 下 6 的 抽样 分 布 


在 例 7. 6 rh, 我 们 将 用 枢 轴 统计 量 求 的 置信 区 间 , 这 里 样本 容量 较 小 , 如 m<30. 
| 017.6. É y fl s 是 来 自 均值 为 ,方差 为 o? TES E EB n 个 观测 值 随机 样本 的 样本 均值 和 
标准 差 . 

a. SH u B (1 -a)100% 置信 区 间 的 表达 式 . 

b. HR y 29.7, 521.1, n=10, 求 凡 的 95% 置 信 区 间 . 

解 a 用 第 6 章 7T 统 计量 来 构造 4 的 枢 轴 统计 量 , 由 定义 6.16, 

Z 
xv 

这 里 2 和 X 是 独立 的 随机 变量 , xz 有 自由 度 v. 我 们 知道 了 是 正 态 分 布 , B 


Z- 
s/n 





T= 


是 标准 正 态 随机 变量 . 由 定理 6. 11 得 


n-1)s? 
LE ) = 


o? 


是 自由 度 为 >= (n -1) 的 卡 方 随机 变量 . 我 们 说 (不 证 ) 24 y m ë 是 基于 取 自 正 态 分 布 的 随机 样本 
BF, 它们 是 独立 的 . 因此 , z 和 x 是 独立 的 随机 变量 . 将 z 和 X 的 表达 式 代 和 人 了 的 表达 式 中 , 得 到 
了 -及 
Z _ o/Vn .Y-n 
inr Je inl py sé 


注意 到 , 枢 轴 统计 量 仅 是 和 样本 统计 量 了 和 s? 的 函数 . 
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求 4 的 置信 区 间 的 下 一 步 是 枢 轴 统计 量 7 的 概率 表达 . 我 们 将 选择 7 的 两 个 值 ( 称 为 ,和 
-ta2) 分 别 对 应 了 分 布 概率 为 a/2 的 上 尾 和 
下 尾 ( 见 图 7.7), 由 图 7.7 可 以 看 出 

P(-t,5xTxt,5) -l-a 

将 了 的 表达 式 代 人 这 个 概率 表达 式 中 ， 

得 到 


f) 


- Y-u 
P( -i Tei) =P( tan] 


RI EDU PRAES D, 得 到 





P| - sa) ntn] 1 -0 图 7.7 "PER TAMSIO LU OR 
不 等 式 每 一部分 减 去 了 得 到 


p| uus TUS -F+ taa 全 =l -a 
最 后 , 不 等 式 的 每 项 同 乘 以 -1, 不 等 式 反 向 , 就 得 到 


P[s (72) sus; nu] -l-a 
因此 , 当 较 小 时 ,4 的 (1 — o) 10096 SAKE E 


ri 

b. 对 于 95% 的 置信 区 间 , a =0. 05 和 ov2 20.025. 我 们 需要 求 10 ps. 387.1 是 表 B.7 的 一 部 分 . 
当 自由 度 >=m-1=9 时 , 加 os =2.262( 表 7.1 中 的 阴影 部 分 ). 

将 7=9.7,s=1.1, n2 10 to os =2.262 代入 a 的 置信 区 间 公式 , 得 到 

L1 
9.7 12. 262 ( | -9.7 +0.79 = (8.91, 10.49) 

因为 置信 系数 是 1 - a=0.95, 所 以 我 们 有 95% 的 信心 相信 在 8.91 ~ 10.49 之 间 的 区 间 包 含 了 均值 内 
的 真 值 . 








自由 度 to, 100 to, 010 to, 005 
1 3. 078 31. 821 63. 657 
2 1. 886 6. 965 9.925 
3 1.638 4.541 5.841 
4 1.533 3.747 4. 604 
5 1.476 3.365 4. 032 
6 1. 440 3. 143 3. 707 
7 1.415 2. 998 3. 499 
8 1. 397 2. 896 3.355 
a 1. 383 2.821 3.250 
10 1.372 2.764 3. 169 
11 1. 363 2.718 3. 106 
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(E) 
一 一” LL LL. 
自由 度 to, 100 10.050 Tos 19.010 10.005 
12 1. 356 1. 782 2. 179 2. 681 3.055 
13 1. 350 1. 771 2.160 2. 650 3.012 
14 1. 345 1. 761 2. 145 2. 624 2.977 
15 1. 341 1. 753 2. 131 2. 602 2.947 
置信 区 间 的 实际 解释 


如 果 参 数 9 的 (1 -a)100% 置 信 区 间 是 (LCL, UCL) ,那么 我 们 有 (1 -a)100% 的 信心 相信 9 落 在 LCL 
fu UCL 之 间 . 





例 7. 6b 的 求解 结果 中 术语 “95% 的 信心 "在 区 间 估 计 中 有 非常 特殊 的 意义 . 为 了 说 明 这 个 问题 ， 
用 蒙特 卡 罗 模 拟 从 一 个 已 知 均值 j=10, o? =1 的 正 态 分布 中 取样 本 容量 n=10 的 100 个 样本 ,对 
100 个 样本 中 的 每 一 个 计算 的 95% 潮 信 区 间 . 结果 见 图 7.8 的 EXCEL THR. 只 有 5 个 着 重 显示 
的 区 间 没 有 包含 均值 j=10. HET u 的 区 间 比 例 是 0. 95, 恰好 等 于 置信 系数 . 这 就 解释 了 为 什么 我 
们 会 有 很 大 的 信心 相信 例 7. 6b 计算 的 区 间 (8. 91, 10.4) 0E T u 的 真 值 如 果 重 复 进行 区 间 估 计 ， 
构造 的 区 间 中 95 儿 包含 了 真 值 几 








Á B Aud 5 881 

SAMPLE LOWER95 |UPPERSS 52 88 
Ui 1 9.35 10.51 53! 874 
2 2 9.65 1146 54| 838 
A 3 832 11.13 -| 32 
5] 4 804 10.17 56 30 
E L mu 
mi 5 9.56 10.88 ^S) — 885 

| 6 842 1074: E m 
ESI 7 95 1033 35 vc 
2 
9| 8 992 10.89 Ei DES 
10] 9 884 1055 : 
30) 81 8.89 
Ent 10 851 10.85 2 am 
32] 11 85 1077 = T 
13] 12 874 10.98 En E 
En 13 971 10.46 A 1 
45] 14 8.18 10.98 10.12 
38] 15 8.92 1067 85 884 
az 18 835 10.72 Ei 343 
18] 17 9.15 10.51 
18] 18 9.82! 1042 89 844 
20] 18 92 10.34 70 858 
21] 20 802 10.67 7 913 
22] 2 9.89 10.87 72 922 
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期 望 有 (1 - a) 10096 的 区 间 包 含 参数 真 值 . 





置信 系数 (1 -a) 的 理论 解释 
如 果 从 一 个 总 体 中 重复 抽取 容量 为 n 的 样本 ,并 对 每 一 个 样本 构造 (1 -a)100% EER, 那么 我 们 








除了 总 体 均 值 以 外 ,其 他 总 体 参 数 的 置信 区 间 可 以 用 本 节 介 绍 的 枢 轴 法 导出 ， 许多 参数 的 估计 
量 和 枢 轴 统计 量 都 是 熟知 的 . 在 7.4 ~7. 10 节 ， 我 们 将 给 出 几 个 总 体 参数 的 置信 区 间 公 式 , 它们 都 是 


在 实际 经 常 遇 到 的 , 并 配 有 实例 予以 说 明 . 


应 用 练习 

7.14 求 1 值 . 利用 表 B.7 确定 i 的 值 ， 并 对 以 下 
置信 系数 和 样本 容量 组 合 , 用 这 个 值 构 造 总 体 均 
值 的 置信 区 间 : 

a. 置信 系数 0. 99, n = 18. 
b， 置 信 系数 0. 95, n = 10. 
c. EAS 0. 90, n = 15. 

7.15 比较 z 和 + 值 . 可 以 证 明 ( 证 明 略 ) 当 样 本 容量 
n 增加 时 ,7 分 布 趋 于 标准 正 态 分 布 , 使 得 P(T > 
la) zo 的 1 近似 等 于 使 P(Z >z ) =a 的 z. 利用 
表 B.7 验证 当 样 本 容量 n 趋向 于 无 穷 时 ， toos = 


79.05» Ío gs =Zo.025 > Éo.o1 三 20.01. 


理论 练习 
7.16 令 了 表示 成 功 概率 为 p 的 n 次 二 项 试验 中 成 
功 次 数 . 假定 n 很 大 ， 利用 样本 的 成 功 比 率 $ = Y/n 
构造 p 的 置信 系数 为 (1 - o) 的 置信 区 间 . (3; 
从 枢 轴 统 计量 
z bcp 


pq 


开始 , 再 利用 (证 明 略 ) 24 n 很 大 时 , Z 是 近似 的 标 
准 正 态 随机 变量 的 事实 . ) 

7.17 vcn y, 是 来 自 均值 为 A 的 泊 松 分 布 
的 随机 样本 . 假定 用 了 作为 A 的 估计 . 推导 的 
(1 -a) 100% 置 信 区 间 . (提示 : 从 枢 轴 统 计量 

7 了 -人 
va 
开始 , 再 说 明 当 nn 很 大 时 , Z 是 近似 的 标准 正 态 随 
机 变量 . 然后 用 了 取代 分 母 中 的 A( 为 什么 能 这 样 
做 ?) 并 用 例 7.6 中 的 枢 轴 法 . ) 

7.38 y, ya e, y, 是 来 自 期 望 为 p 的 指数 分 布 
随机 样本 , 推导 大 样本 下 有 RSKI. (提示 : 从 
枢 轴 统 计量 

_7-8 
Z PT 


N 


开始 , FHM n 很 大 时 , Z 近似 为 标准 正 态 随机 
变量 . 然后 用 7 了 取代 分 母 中 的 B( 为 什么 能 这 样 
152) 并 用 例 7.6 中 的 枢 轴 法 . ) 

19 Ey, s 分别 表示 来 自 均值 为 ,方差 为 
el 总 体 的 容量 为 n 的 样本 均值 和 样本 方差 类 似 
地 , EX y, M s) 分 别 表示 来 自 均值 为 几 , 方差 为 
o, 总 体 的 容量 为 n 的 样本 均值 和 样本 方差 . 推导 
大 样本 下 (Am -pw ) 的 置信 区 间 . (提示 : 利用 枢 轴 
统计 量 


z.0 -y) - n - u) 





再 说 明 当 n 很 大 时 , Z 近似 标准 正 态 随 机 变量 . 
然后 用 si 代替 分 母 中 的 of; 用 s? 代替 分 母 中 的 
az( 为 什么 能 这 样 做 ?) 并 用 例 7.6 中 的 枢 
轴 法 . ) 


.20 (Y, s) ROS, 号 ) 分 别 表示 来 自 有 不 同 均 


u Mu, WAJE o7. 正 态 总 体 的 容量 为 n, 和 
n, 的 两 个 独立 样本 的 均值 和 方差. 
a. 证 明 : E(y, -») 一 HT Ha. 
b. WEAH: 
aeti) 
c. 解释 为 什么 
z. 人 -»y) - (m -Ha ) 





是 一 个 标准 正 态 随机 变量 . 


-21 参考 练习 7. 20. 根据 定理 6.11， 


2 (m -1)si 
2 


(n, -1)s 
] 一 a 


Gg 
分 别 是 自由 度 为 n, -1 和, — 1 的 独立 卡 方 随机 变 
量 . 证 明 : 
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2_(m-1)s + (n -1)5 p 7X2 - Qn H) 
i o° 1 1 
S /一 + 一 
是 一 个 自由 度 为 (m +m -2) 的 卡 方 随机 变量 . f m m 
idm. 示 : 利用 了 = Z/ wz 是 一 个 自由 度 为 z 的 学 生 氏 
(n, - Dé + (n, - D T 分布 ,再 利用 练习 7. 20e 和 7.21 的 结果 . ) 
mn 7.23 ”利用 练习 7. 22 给 出 的 枢 轴 统计 量 7 推导 小 样 


- 本 下 (jp 75) (1 -a)100% 置信 区 间 . 
: 


7.4 总体 均值 的 估计 


在 7.2 节 的 讨论 中 , 我 们 已 经 知道 总 体 均值 w 的 有 用 点 估计 是 样本 均值 元 根据 中 心 极 限定 理 
(定理 6.9) ,我们 知道 对 充分 大 的 n, 样本 均值 的 抽样 分 布 近似 为 E(F) =u, VF) = o2/n 的 正 态 
分 布 . E(y) =p 说 明了 是 w 的 一 个 无 偏 估计 . 进一步 可 以 证 明 ( 证 明 略 )7 在 mr 的 所 有 无 偏 估计 中 具有 
最 小 方差 , FD y Ecua ËJ MVUE, 因此 y 是 jw 的 最 佳 估 计量 . 

因为 当 较 大 时 了 近似 正 态 分 布 , 所 以 我 们 可 以 利用 定理 7. 2 来 构造 w 的 大 样本 (1 - a ) 100% 
置信 区 间 . 将 9= 了 和 ef =o/Va 代 入 定理 7.2 给 出 的 置信 区 间 公 式 中 , 就 得 到 下 面 方 框 中 的 公 于 


总 体 均值 的 大 样本 (1 -ww) 100% 置信 区 间 


_ _ oi. s 
y t2,50; esa) (7) 
其 中 zs 是 它 的 右边 面积 为 a/2 的 z 值 ,er 是 抽样 总 体 的 标准 差 ， 是 样本 大 小 ,了 是 样本 均值 . 
iE: š o 值 未 知 时 (通常 是 这 样 ), 样本 标准 差 s 可 以 用 来 近似 代替 置信 区 间 公 式 中 的 o 3 n>30 时 ， 
这 种 近似 一 般 相 当 满 意 了 . 
假定 : 没有 ( 因为 中 心 极限 定理 保证 了 无 论 抽样 总 体 服从 什么 分 布 ,了 均 近 似 正 态 . ) 

















E: 7 的 抽样 分 布 近 似 正 态 时 ,所 要 求 的 样本 容量 风 的 大 小 非常 依赖 于 原 总 体 的 形状 ( 见 例 
6. 18 和 例 6.19). 作为 一 般 的 经 验 法 则 ， 对 于 应 用 中 心 极限 定理 , n=30 可 以 认为 是 足够 大 了 . 
假设 需要 估计 一 台 PC 机 的 硬盘 存储 系统 的 性 能 . 一 个 指标 是 检测 硬盘 驱动 器 故障 之 间 的 
平均 时 间 间 隔 . 为 了 估计 这 个 值 , 对 45 个 硬盘 驱动 器 故障 的 随机 样本 记录 了 故障 时 间 间 隔 , 经 计算 
得 到 如 下 样本 统计 量 : 

7= 1762h  s-215h 

a. 用 90% 置信 区 间 估 计 平 均 故 障 时 间 间 隔 的 真 值 . 

b， 如 果 硬 盘 驱动 存储 系统 运转 正常 ,故障 时 间 间 隔 平 均 的 真 值 将 超过 1 700 h. 依据 a 的 区 间 估 
YF, 你 对 这 个 硬盘 存储 系统 能 推断 出 什么 ? 

BR a 对 置信 系数 1 - a=0.90, RIA a=0.10 81/2 =0.05. 因此 ,的 90% 置信 区 间 是 

y szan r) =Y + Z0, 05 (a =Y X Zo 05 (5) =1 762 x zo os 人 E 

其 中 z.os 对 应 上 尾 面积 为 0.05 的 z 值 . 由 表 B. 5 查 得 2z0.05 = 1. 645. 因此 所 求 的 区 间 是 


215 215 
1 762 zo | ss) =1 762 +1. as 5] =1 762 +52.7 
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或 者 1 709.3 ~1 814.7 h 之 间 . 我 们 有 90% 的 信心 相信 区 间 (1 709.3, 1 814.7) 包 含 了 硬盘 故障 时 间 
间隔 的 真 值 作 

b. 因为 90% 置信 区 间 内 的 所 有 值 都 超过 了 1 700 h, 所 以 我 们 推断 (以 90% 的 信心 ) 硬 盘存 储 系 
统 工作 正常 . 

有 时 由 于 有 限 的 时 间 和 费用 , 用 于 估计 的 样本 观测 值 个 数 可 能 受到 限制 . 在 小 样本 情况 下 
(n«30), 会 存在 以 下 两 个 问题 : 

L 由 于 中 心 极限 定理 只 适合 大 样本 情况 , 我 们 不 能 再 假定 7 的 抽样 分 布 近似 正 态 . 因此 不 能 应 
用 定理 7. 2. 对 于 小 样本 , 了 的 抽样 分 布依 赖 于 被 抽样 总 体 相 对 频率 分 布 的 具体 形式 . 

2. 如 果 样 本 容量 太 小 , 样本 标准 差 * 有 可 能 不 再 是 总 体 标准 差 满 意 的 近似 . 

幸运 的 是 ,如 果 可 以 假定 选取 样本 的 总 体 有 近似 正 态 分 布 , 我 们 可 以 执行 基于 小 样本 的 估计 方 
法 . THEE HEUS MG LUAM 7.6 STIR u 的 置信 区 间 . 下 面 的 方 框 中 给 出 了 基于 学 生 氏 了 


总 体 均值 w 的 小 样本 (1 — a) 00% 置信 区 间 
veta.) 
其 中 tp 由 自由 度 为 -1 的 学 生 儿 了 了 分布 可 得 . 
假定 : 抽样 总 体 近 似 服 从 正 态 分 布 . 














美国 能 源 部 为 了 研究 用 热 的 、 高 含 盐 量 的 海水 产生 电流 的 可 能 性 , 将 地 热 回路 实验 装置 安 
装 在 加 利 福 尼 亚 州 南部 的 素 尔 顿 海 . 实验 表明 这 些 盐水 使 得 二 氧化 硅 水 垢 附着 在 金属 输送 管道 , 引 
起 输送 量 过 度 减 少 . Jacobsen 等 ( Journal of Testing and Evaluation, 1981 年 3 月 ) 发 现 向 盐水 中 加 入 化 
学 溶液 可 以 稍微 减少 水 垢 . 在 一 个 实验 板 上 , 有 5 种 阻 垢 剂 , 将 每 一 种 都 放 到 盐水 中 并 过 滤 溶 液 . 放 
置 24h 后 , 测定 每 一 个 过 滤 样本 的 二 氧化 硅 水 垢 附着 量 ( 百 万 分 之 一 ) , 结果 见 表 7.2. 估计 出 现在 5 
种 除 垢 剂 溶液 中 二 氧化 硅 的 平均 值 , 使 用 99% 置信 区 间 . 


解 ” 构 造 置信 区 间 的 第 一 步 是 计算 5 个 二 氧化 硅 量 的 样 表 7.2 例 7.8 中 二 氧化 
本 均值 Y 和 标准 差 s. 结果 是 Y=239.2 和 s=29.3, 见 图 7.9 硅 水 垢 测量 值 
中 的 阴影 部 分 . 229 255 280 — 200 — 229 





对 置信 系数 1 - 020.99, H 020.01, 9/2 20.005. 由 于 
样本 容量 很 小 (n=5)， 这 就 要 求 出 现在 阻 拍 剂 溶液 中 的 二 氧化 硅 量 近似 服从 正 态 分 布 ( 即 5 个 一 氧 
化 硅 量 的 样本 来 自 正 态 总 体 ). 

将 了, s 和 的 值 代入 j 的 小 样本 区 间 估 计 公 式 , 得 到 


_ 29.3 
veta) = 了 + os | =] = 239. 2 tos | us) 
其 中 to o0s 是 相应 于 自由 度 为 (n -1) = 4 的 学 生 氏 了 了 分布 的 上 尾 面 积 0.005 的 值 . 由 表 B. 7 查 得 
to.005 =4. 604. 将 这 个 值 代入 上 式 得 


29. 
239.2 et as |” ) = 239.2 + (4. s) (525) = 239. 2 +60. 3 


或 者 178. 9 ~299. 5 ppm. (iX; 这 个 区 间 是 图 7.9 中 的 着 重 显示 部 分 . ) 因此 ， 如 果 二 氧化 硅 量 近似 服 
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从 正 态 分 布 , 我 们 可 以 有 99% 的 信心 相信 区 间 (178.9, 299.5) 包 含 了 出 现在 阻 拍 剂 溶液 中 的 二 氧化 
硅 量 的 平均 值 a. 





One-Sample T: PPM 


Variable N Hean StDev SE Mean 99% CI 
PPH s 239.200 29.295 13.101  (1786.881,-299.519] 








图 7.9 二 氧化 硅 数 据 的 MINITAB 描述 性 统计 量 和 置信 区 间 


在 本 节 的 最 后 还 需要 强调 两 点 . 第 一 点 是 抽样 总 体 是 正 态 分 布 的 假定 . 实际 中 , 我 们 很 少 知道 抽 
样 总 体 是 精确 的 正 态 分 布 . 但 是 经 验 告诉 我 们 , 与 这 个 假定 适当 的 偏离 ,并 不 会 严重 影响 小 样本 下 
置信 区 间 的 置信 系数 . 例如 ,如 果 例 7.8 溶液 中 的 二 氧化 硅 量 的 分 布 是 丘 形 但 不 是 正 态 的 , 那么 
99% 的 置信 区 间 的 实际 置信 系数 可 能 接近 0.99, 至 少 对 实际 应 用 已 经 是 足够 的 近似 . 总 之 , 当 估计 
非 正 态 分 布 总 体 的 均值 时 ,只 要 分 布 是 丘 形 的 , 并 且 仅 适 度 偏 斜 , 实验 人 员 经 常 使 用 小 样本 置信 区 
间 . 当 总 体 分 布 严 重 偏离 正 态 性 时 , 我 们 推荐 使 用 其 他 估计 方法 ( 如 稳健 估计 ) 或 者 分 布 自由 法 ( 称 
作 非 参数 ). 非 参数 统计 是 第 15 章 的 内 容 . 

第 二 点 要 强调 o 是 已 知 还 是 未 知 . 在 前 面 (第 6 章 ) 已 经 介绍 过 当 o 已 知 且 抽 样 总 体 服从 正 态 分 
布 时 , 不管 样本 容量 大 小 , y 的 抽样 分 布 都 是 正 态 的 . 也 就 是 说 , 如 果 已 知 e 的 值 , 并 且 知 道 样 本 来 
BESIM, 就 可 以 用 z 分 布 而 不 是 :分布 来 构造 置信 区 间 . 但 实际 上 很 少 (如 果 有 过 ) 知道 o 的 值 ， 
因此 总 是 用 * 代替 置信 区 间 公 式 中 的 o, 而 7 的 抽样 分 布 就 是 学 生 氏 了 分 布 . 这 就 是 为 什么 这 一 节 前 
面 给 出 的 大 样本 置信 区 间 公 式 仅仅 是 一 个 近似 结果 , 在 大 样本 条 件 下 , 1 二 z 很 多 统计 软件 包 给 出 了 
0 未知 时 精确 的 置信 区 间 结果 . 这 些 结果 都 是 依据 7 分 布 给 出 的 . 在 实际 应 用 中 , 需要 根据 样本 的 大 
小 来 决定 是 使 用 2 还 是 使 用 7 置信 区 间 . 


(3) 应 用 练习 2.5 um 吗 ? 为 什么 ? 
7.24 管道 表面 粗糙 度 . 参考 练习 2. 16, Anti- corro- 
sion Methods and Materials ( Vol. 50, 2003 ) 关 于 石油 
管道 内 表面 镀层 的 粗糙 度 研 究 . 20 节 管 道 样本 数 2.57 2.64 1.26 2.05 1.19 2.13 1.27 1.51 2.41 1.95 


—_ m 
1.72 2.50 2.16 2.13 1.06 2.24 2.31 2.03 1.09 1.40 





———————————————ÉÁÉÉ—— 

据 ( um) 复制 在 下 表 中 , 用 MINITAB 做 数据 分 析 . 资料 来 源 : Farshad, F. , and Pesacreta, T. “Coated pipe in- 
a. 在 MINITAB 输出 中 ， 找 出 管道 内 表面 镀 层 粗 糙 terior surface roughness as measured by three scanning probe 
度 平 均值 的 95% 置信 区 间 . instruments. " An£i- corrosion Methods and Materials, Vol. 50, 


b. PRAA EE E PI e HL 82 a R 88 Be BUE 2: N No. 1, 2003 ($M). 





One-Sample T: ROUGH 


Variable N Mean StDev SE Mean 9S% CI 
ROUGH 20 1.88100 0.52391 0.11715 (1.63580, 2.12620) 








练习 7. 24 的 MINITAB 输出 
7.25 热传导 研究 . 已 知 同 质 材料 的 热流 速度 和 温度 是 要 估计 几 种 非 同 质 材料 的 平均 散热 时 间 ( 用 来 散 
梯度 之 间 的 理论 关系 可 以 用 侍 里 叶 方 程 描述 . 但 是 发 所 积累 热量 的 平均 时 间 ). 沙子 平均 散热 时 间 的 
对 非 同 质 材料 , 如 多 孔 毛 细 管 状 物体 、 分 格式 系 95% 置信 区 间 是 20.0 +6. 4 s. 
统 、 悬 泽 液 和 面糊 样 的 物体 ,这 种 关系 不 成 立 . 下 a. 给 出 95% 置信 区 间 的 实际 解释 . 
面 的 实验 (Journal of Heat Transfer, 1990 年 8 月 ) 就 b. 给 出 95% 置信 区 间 的 理论 解释 . 
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26 来 自 星系 的 光速 , 参考 练习 2. 39, The Astro- 

nomical Journal(1995 年 7 H ) ps Ë 3 H rh E xim 

光速 研究 . 位 于 星云 团 A2142 的 103 个 星系 样本 的 

平均 速度 为 了 7= 27 117 km/s, 标准 差 为 s=1 280 

km/s. 假设 目的 是 对 A2142 中 星系 总 体 的 平均 光速 

进行 推断 . 

a. 在 练习 2. 39 的 b 中 , 构造 了 一 个 包含 大 约 95% 
星云 团 中 星系 速度 区 间 . 解释 为 什么 这 个 区 间 对 
这 个 推断 是 不 合适 的 . 

b. 对 星云 团 A2142 中 的 所 有 星系 散发 的 平均 光速 ， 
构造 95% 置信 区 间 . 解释 所 得 结论 . 


.27 ”新泽西 井 水 的 污染 . 甲 基 叔 丁 基本 (MTBE) 是 


一 个 由 于 石油 泄漏 而 导致 的 有 机 物 水 污染 指标 . 测 
量 了 新 泽 西 加 油 站 附近 的 12 口 井 水 的 MTBE zk E 
( 百 万 分 之 一 ). (Environmental Science & Technolo- 
gy, 2005 年 1 月 . ) 数 据 列 在 附 表 中 . 
150 367 38 12 11 
12 251 63 8 13 
资料 来 源 : Kuder, T., 
and hydrogen isotopes during anaerobic biodegradation of MT- 


134 
107 


et al. “ Enrichment of stable carbon 


BE; Microcosm and field evidence. " Environmental Science & 
Technology, Vol. 39, No. 1, Jan. 2005 ( Table 1). 


a. 求 新 泽 西 加 油 站 附近 所 有 并 的 MTBE 真实 平均 
水 平凡 的 点 估计 . 

b. 计算 并 解释 4 的 99% 置信 区 间 . 

c. 为 使 b 中 的 置信 区 间 有 效 , 需要 什么 假定 ?这 
些 假定 满足 吗 ? 


.28 工科 学 生 的 智力 开发 . 参考 练习 1. 19, Journal 


of Engineering Education(2005 年 1 月 ) 关 于 大 学 工 
科学 生 智力 开发 的 研究 . 测量 了 大 学 一 年 级 项 目 设 
计 课 的 21 名 学 生 智力 开发 的 (Perry) 得 分 . (得 分 为 
1 表示 智力 发 展 的 最 低 水 平 , 得 分 为 5 表示 智力 发 
展 的 最 高 水 平 . ) 这 21 名 学 生 的 平均 得 分 为 3. 27， 
标准 差 为 0.40. 利用 本 节 的 置信 区 间 方 法 估计 所 有 
一 年 级 工科 学 生 智力 发 展 水 平 的 平均 得 分 真 值 的 
99% 置信 区 间 . 对 结果 加 以 解释 . 


.29 放射 性 地 衣 . 参考 练习 2.11 放射 性 地 衣 基 础 


研究 项 目 . 阿拉 斯 加 大 学 的 研究 者 搜集 了 阿拉 斯 加 
州 不 同 地 方 的 放射 性 元 素 饮 -137 的 9 个 地 衣 样 品 . 
测定 数据 ( 微 居 里 /毫升 ) 见 下 表 . 

0.0040868 0.015764 0.003579 000739 

0.0 165727 0.0067379 000828 0.0111090 0.0100518 
资料 来 源 : Lichen Radionuclide Baseline Research project, 2003. 








N 


N 


a. 描述 研究 者 所 关心 的 总 体 . 

b. 用 95% 置信 区 间 估 计 总 体 均值 . 

c 对 总 体 均值 的 大 小 做 出 推断 . 

d. 为 使 推断 成 立 , 总 体 数 据 必须 怎样 分 布 . 


.30 检测 腿 部 运动 的 阻抗 . 参考 练习 2.36 IEICT 


Transactions on Information & Systems (2005 年 1 月 ) 关 

于 检测 腿 部 运动 阻抗 的 试验 . 工程 师 把 电极 系 在 志 

愿 者 的 脚 躁 和 膝盖 上 , 然后 测量 其 阻抗 变化 的 信 噪 

比 (SNR). 用 某 个 脚 踩 - 膝盖 电极 测量 了 10 名 志愿 

者 样本 的 SNR 值 , 均值 为 19. 5, 标准 差 为 4.7. 

a 构造 阻抗 变化 SNR 平均 值 真 值 的 95% 置 
信 区 间 . 

b. 在 练习 2.36 中 , 求 出 了 一 个 包含 总 体 中 大 约 
95% SNR 值 的 区 间 . 将 这 个 区 间 与 a 中 的 置信 区 
间 比 较 . 解释 为 什么 这 两 个 区 间 不 同 . 

31 AARP 0464648. 美国 佛 购 里 达州 希 尔 兹 

堡 县 水 利 部 门 定期 检测 居民 饮用 水 中 铅 和 铜 的 含 

量 . 琉璃 湖 庄园 小 区 的 10 户 居民 样本 饮用 水 的 馈 

和 铜 的 含量 如 下 . 





铅 (pg/L) 铜 (mg/L) 
1.32 0. 508 
0 0. 279 

13.1 0.320 
0.919 0.904 
0.657 0.221 
3.0 0.283 
1.32 0.475 
4.09 0.130 
4.45 0.220 
0 0.743 


—— ——— ell V) 
资料 来 源 : Hillsborough County Water Department Environ- 
mental Laboratory, Tampa, Florida. 


a. AII 3 HE Pa /]N XC E tk Hik E a rh i ES an 
含量 构造 99% 置信 区 间 . 

b. 对 琉璃 湖 庄园 小 区 居民 饮用 水 样品 中 的 平均 铀 
含量 构造 99% 和 置信 区 间 . 

c. 用 本 问题 的 语言 解释 a 和 中 的 置信 区 间 . 

d. 讨论 “99% 置信” 的 含义 . 

32 烤箱 误 调 研究 . 哈佛 大 学 公众 健康 学 院 的 一 个 

研究 小 组 研究 了 豪 调 对 室内 微粒 大 小 的 影响 . ( En- 

vironmental Science & Technology, 2000 年 9 月 1 

H. ) 在 随机 选 出 的 6 天 中 记录 由 烤箱 烹调 或 烘 烤 

产生 的 细微 颗粒 的 衰退 速度 (jm/h) 如 下 . 
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0.95 0.83 120 089 1.45 1.12 
资料 来 源 : Abt, E. , etal. , 


: . : : » 
door and indoor particle sources to indoor concentrations. " En- 


“ Relative contribution of out- 


vironmental Science & Technology, Vol. 34, No. 17, Sept. 1, 
2000 (X 3). 


a. 构造 并 说 明 烤 箱 在 亮 调 或 烘 烤 食品 时 产生 的 细 
微 颗粒 的 训 退 速度 真 值 的 95% 置信 区 间 . 

b. 解释 a 中 术语 “95% 置信 ”的 含义 . 

c. 为 使 推断 有 效 , 关于 衰退 速度 的 总 体 分 布 中 哪 
些 必须 是 真实 的 ? 

.33 DOT 交通 流量 统计 . 在 美国 通常 依据 一 年 中 第 
30 个 最 高 每 小 时 的 交通 流量 来 设计 道路 的 运载 服务 
能 力 . 因此 , 除了 29 h 以 外 , 所 有 的 道路 设施 在 一 
年 中 期 望 处 于 可 接受 的 服务 水 平 运行 中 . 但 是 佛 罗 
里 达州 的 交通 部 (DOT) 将 第 30 个 最 高 小 时 改 为 第 
100 最 高 小 时 作为 服务 水 平 基础 . 佛罗里达 大 西洋 大 
学 的 研究 员 Reid Ewing 在 Journal of STAR Research 
(1994 年 7 月) 中 研究 了 这 种 改变 是 否 合理 . 附 表 给 
出 了 随机 选取 的 DOT 常设 测量 点 测 得 的 最 近 一 年 的 
第 30 最 高 小 时 和 第 100 最 高 小 时 的 交通 流量 . 








站 点 道路 第 30 最 第 100 最 
类 型 高 小 时 高 小 时 
0117 小 城市 1 890 1 736 
0087 休养 2 217 2 069 
0166 小 城市 1 444 1 345 
0013 农村 2 105 2 049 
0161 城市 4 905 4 815 
0096 城市 2 022 1 958 
0145 农村 594 548 
0149 农村 252 229 
0038 城市 2 162 2 048 
0118 农村 1 938 1 748 
0047 农村 879 811 
0066 城市 1 913 1 772 
0094 农村 3 494 3 403 
0105 小 城市 1 424 1 309 
0113 小 城市 457 4 425 
0151 城市 3 494 3 359 
0159 农村 2 222 2 137 
0160 小 城市 1 076 989 
0164 休养 2 167 2 039 
0165 休养 3 350 3 123 


资料 来 源 : Ewing, R. “ Roadway levels of service in an era of 
growth management. " Journal of STAR Research, Vol. 3, July 
1994, p. 103( Table 2). 


a 描述 抽样 总 体 . 

b. 样本 能 代表 总 体 吗 ? 为什么. 

c. 计算 并 解释 第 30 最 高 小 时 交通 量 平均 值 的 95% 
置信 区 间 . 

d. 为 使 置信 区 间 有 效 ， 必 须 的 假定 是 什么 ? 假定 
能 得 到 满足 吗 ? 为 什么 . 

e， 对 第 100 最 高 小 时 交通 量 重复 和 d. 


.34 冰 融 化 池 的 反照 率 . 参考 美国 国家 冰雪 数据 中 


心 (NSIDC) 测 得 的 加 拿 大 北极 冰 融 化 池 的 反照 率 、 

深度 和 物理 特性 数据 , 第 一 次 出 现在 例 2.1. 反照 

率 是 冰 吸 收 光 与 冰 反 射 光 的 比率 . (高 反照 率 使 冰 

呈现 白色 . ) 记录 了 从 加 拿 大 北极 圈 巴 罗 海 峡 504 

座 冰 融化 池 样 本 得 到 的 反照 率 , 这 些 数据 保存 在 

PONDICE 文件 中 . 

a 求 所 有 加 拿 大 北极 冰 池 得 到 的 反照 率 平均 值 真 
值 的 90% 置信 区 间 . 

b. 从 实际 和 理论 的 角度 分 别 解释 所 求 的 置信 
IX [8]. 

c. 按照 例 2. 1, 将 每 个 冰 池 分 为 一 年 冰 、 多 年 冰 或 
者 定 着 冰 . 对 这 3 类 中 的 每 一 类 , 求 平均 反照 率 
的 90% 置信 区 间 . 


.35 频 临 灭绝 的 新 西 兰 岛 类 . 参考 例 1. 10, Evolu- 


tionary Ecology Research (2003 年 7 月 ) 对 欧洲 人 入 

住 之 前 的 新 西 兰 鸟 类 总 体 的 研究 . 测量 了 116 Rh 

类 的 身体 质量 (g) 和 和 蛋 的 长 度 (mm). 这 些 变量 的 描 

述 性 统计 量 见 MINITAB 输出 结果 . 

a. 从 NZBIRDS 文件 中 用 随机 数 发 生 器 选择 35 种 
鸟 类 的 样本 . 

b. 计算 这 35 种 鸟 类 身体 质量 抽样 值 的 均值 和 标准 
差 . 并 用 它们 去 构造 所 有 116 种 鸟 类 身体 质量 均 
值 的 95% 置信 区 间 . 

c. 从 实际 角度 解释 b 中 的 置信 区 间 . 

d. 检查 均值 真 值 (表示 在 MINITLAB 输出 ) 是否 
包含 在 b 的 置信 区 间 中 . 解释 为 什么 这 个 区 间 以 
很 大 的 可 能 性 包含 了 从 

e. 对 35 个 鸟 类 的 蛋 长 重复 b ~ d. 








Descriptive Statistics: Body Mass, Egg Length 


Variable N Mean StDev Minimum Maximum 
Body Mass 116 9113 31457 7.00 200000 
Egg Length 115 61.06 45.46 16.00 
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练习 7.35 的 MINITAB 输出 
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7.5 两 个 总 体 均 值 差 的 估计 : 独立 样本 


在 7.4 节 , 我 们 学 习 了 如 何 估计 单个 总 体 参 数 . 现在 我 们 要 利用 两 个 独立 收集 的 样本 信息 估计 
两 个 总 体 均 值 差 (ji -jp2). 例如 ,比较 机 械 工程 和 土木 工程 大 学 毕业 生 的 平均 起 始 工 资 , 或 者 比较 
安装 转 式 发 动机 和 安装 标准 发 动机 的 汽车 的 平均 运行 费用 , 或 者 比较 两 种 电子 元 件 的 平均 故障 时 
E. 下面 介绍 的 方法 是 单个 总 体 均 值 估计 方法 的 直接 推广 . 
假设 从 均值 分 别 为 1 和 jz 的 两 个 总 体 中 抽取 了 容量 分 别 为 n, 和 n 的 独立 随机 样本 . 直观 地 ， 
我 们 想 用 样本 均值 差 (Yi -7 ) 去 估计 (ji -pz). 在 例 6.20 中 ,我们 已 经 证 明 : 
E(Y1 - y3) =u - ia 
_ 2. 091 oj 
VCyy - y) ^nm 
可 见 , (y, -y Æ Qua m) 的 一 个 无 偏 估计 . 进一步 , 可 以 证 明 ( 证 明 上 略 )V(Y1 -7 ) 是 所 有 无 偏 估计 
中 最 小 的 , BC. -y2 ) Æ (ua -12) 的 MVUE. 
由 中 心 极限 定理 , 对 于 足够 大 的 nl 和 ns, 无论 抽样 总 体 的 分 布 是 什么 ,，(71 =- 交 ) 近 似 服从 正 态 
分 布 . 因此 可 以 应 用 定理 7.2 构造 (AI -jz ) 的 大 样本 置信 区 间 . 下 面 的 方 框 中 给 出 了 构造 (jp -jp ) 
的 大 样本 置信 区 间 的 方法 . 





(u, -p12) 的 大 样本 (1 —a)100% 置信 区 间 : 独立 样本 


2 2 2 2 

_ _ _ _ 01 05 _ _ $1 $5 
一 tzan z) F _ tz 1 -一 + 一 = 一 + 一 -+ 一- 
(y, - y>) 29 (y y.) (y, -») a/2 n, n, (y, -») Za/2 n, n, 


CÈ: 用 样本 方差 si 和 s, 作为 相应 总 体 参 数 的 近似 . ) 
假定 : 1. 两 个 随机 样本 是 从 目标 总 体 中 独立 抽取 的 ， 即 一 个 样本 中 元 素 的 抽取 不 影响 另 一 个 样本 中 元 
素 的 抽取 ， 也 不 被 另 一 个 样本 中 元 素 的 抽取 所 影响 . 
2. 为 了 应 用 中 心 极限 定理 , 样本 容量 n # n, REB KOGER n 230 # n, 230). 











估计 密 软 根 大 学 (UM) 机 械 工程 和 电子 工程 最 近 毕业 生 的 平均 起 始 工资 之 差 . 可 以 利用 下 
面 的 信息 9 : 
1. 59 个 UM 机 械 工程 毕业 生 的 随机 样本 , 产生 的 样本 均值 是 48 736 美元 , 标准 差 是 4 430 美元 . 
2. 30 个 UM 电子 工程 毕业 生 的 随机 样本 , 产生 的 样本 均值 是 53 208 美元 , 标准 差 是 4 286 美元 . 
解 ” 令 下 标 1 表示 机 械 工程 毕业 生 , 下 标 2 表示 电子 工程 毕业 生 . 再 定义 如 下 符号 ; 


pa = 所 有 最 近 UM 机 械 工 程 毕业 生 总 体 的 平均 起 始 工资 表 7.3 例 7.9 的 信息 汇总 
m = 所 有 最 近 UM 电子 工程 毕业 生 总 体 的 平均 起 始 工资 机 械 工程 。 ”电子 工程 





类 似 地 , D: y, Ry» 分 别 表示 样本 均值 ; s 和 sz 分 别 表示 样 ”样本 容量 — m=59 n, =30 

本 标准 差 ; ni 和 no 分 别 表示 样本 容量 . 这 些 已 知 信息 汇总 在 “样本 均值 y, =48736 元 =53 208 

表 7. 3 m. 样本 标准 差 s, =4 430 s, =4 286 
基于 目标 总 体 独立 的 大 样本 ，(Ai — 2) BJ 95% 置信 区 间 22443. a ROT RUE rh Ë. 





O 这 个 例子 的 信息 来 自 密 舱 根 大 学 的 工程 职业 资源 中 心 的 2003 一 2004 毕业 生 调 查 报告 . 
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的 一 般 形式 如 下 : 


Oi -72) NER 
_ tz + 
yí - > 0.025 n m 


由 于 zo oos =1. 96. 利用 表 7.3 的 信息 ， 进行 以 下 代入 , 得 到 所 求 的 置信 区 间 
(48 736 -53 208) + 1. 96,/o1⁄59 + 92/30 


= (48 736 -53 208) + 1. 96./ (4 430)2/59 + (4 286) 1/30 
= —4 472 +1 905 
或 者 ( -6 377, -2 567). 
如 果 用 这 种 方法 重复 生成 总 体 均值 差 (W — ) 的 置信 区 间 ， 我 们 期 望 有 95% 的 区 间 包 含 (1 - 
n). 因为 区 间 仅 包含 了 负 的 差 , 我 们 有 理由 相信 UM 的 机 械 工程 毕业 生 的 平均 起 始 工资 比 电子 工程 
毕业 生 的 平均 起 始 工 资 低 2 567 ~6 377 美元 之 间 . 











(0, -0,) 置信 区 间 的 实际 解释 
设 (LCL, UCL) # (0, - 0,) 88 (1 — a)100% 置信 区 间 . 
° 如 果 LCL>0, H UCL>0, 那么 0 > 6,. 
° 如 果 LCL<0, H UCL <0, 那么 0, < 6. 
° 如 果 LCL<0, B UCL>0( E K 1 8,20), 那么 没有 证 据说 明 0, 和 0, 的 不 同 . 

















基于 两 个 总 体 的 小 样本 , 利用 学 生 氏 7 了 分布 导 出 了 (nl — no ) 的 置信 区 间 . 与 由 小 样本 信息 估计 
单个 总 体 均值 的 情况 一 样 ， 我 们 必须 对 两 个 总 体 的 相对 频率 分 布 做 出 明确 的 假定 , 兄 下 面 的 框 格 . 如 
灯 两 个 样本 中 有 一 个 容量 较 小 时 ( 即 n <30 或 mm <30), 这 些 假 定 是 必要 的 . 





(mı -2) 的 小 样本 (1 -a)100% EERE: 独立 样本 且 oi =o 
(y, -») ENA +) 


2 (m -1)s + (n, - 1) 

















n +n, -2 
并 且 GET Ë HE nj +n, -2 的 值 . 
假定 : 1， 两 个 抽样 总 体 的 相对 频率 分 布 近似 正 态 . 
2， 两 个 总 体 的 方差 o 和 o> 相等 . 
3. 随机 样本 是 从 两 个 目标 总 体 中 独立 抽取 的 . 











注意 到 , 这 种 方法 要 求 样本 来 自 方差 相等 的 两 个 正 态 总 体 ( 即 o? = 02 = 92). 因为 假定 方差 相 
等 , 所 以 可 以 利用 两 个 样本 包含 的 信息 来 构造 o? 的 估计 量 . 这 个 合并 估计 记 作 ss, 计算 方法 见 上 面 
的 框 格 . 你 可 能 注意 到 ,s? 是 两 个 样本 方差 2 和 52 的 加 权 平 均 , 权重 与 各 自 样本 的 容量 成 比例 . 
OE Journal of Testing and Evaluation(1981 4 7 H ) 报 道 了 未 定 级 沥青 混凝土 的 稳定 性 和 渗透 
性 实验 测试 结果 . 作为 实验 的 一 部 分 , 分 别 对 沥青 含量 为 3% 和 7% 的 两 类 混凝土 的 4 个 样品 进行 比 
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较 . 通过 使 脱 气 的 水 流 经 样品 , 测量 水 的 损失 量 , 确定 每 个 混凝土 样品 的 水 渗透 性 . 8 个 混凝土 样品 
的 渗透 性 测量 值 (in/h) 列 在 表 7.4 中 . 求 沥青 含量 为 3% 和 7% 的 两 类 混凝土 平均 渗透 性 之 差 的 
95% 置信 区 间 , 并 解释 这 个 结果 . 

# 首先 , 我 们 用 计算 机 计算 两 个 样本 的 表 7.4 例 7.10 中 3% 和 7% 沥 青 混凝土 





均值 和 方差 . 两 个 样本 的 SAS 输出 描述 性 统计 渗透 性 测量 数据 | 

量 结果 见 图 7.10. OE US EE EU 390 的 样本 ， PP 3% 1189 840 100 980 
3 Wi 

y; =1 007.25 Hs, 2143. 66; 对 沥青 含量 为 7% 7% 853 — 900 733 785 

的 样本 , y, =817.75 H ss =73. 63. 资料 来 源 ; Woelfl, G., Wei, I , Faulstich, C. , and Litwack, 


H 于 两 个 样本 都 很 / 仆人 ny = ny = 4), 这 种 方 n. < Laboratory testing of asphalt conerete for porous pave- 
法 要 求 渗透 性 测量 值 的 两 个 样本 是 独立 的 且 随 ments. "Journal of Testing and Evaluation, Vol. 9, No. 4, July 


机 地 取 B 等 方差 的 正 态 分 布 总 体 的 假定 . 1981, pp. 175 - 181. Copyright American Society for Testing 
小 样本 的 95% 置信 区 间 是 : and Materials. 


(Fa — 2) + toos [x taz) = (1 007.25 -817. 75) Tio: Is 4) 
其 中 zo oss = 2. 447 是 从 基于 自由 度 为 m +n, -2=4+4-2=6 的 了 分 布 表 ( 表 了 B.7) 查 得 , HE 


-1)s+(m -1)s? 2 2 
ë „0 )sp + (n, )ss _3(143. 66) +3(73. 63) 213108. 55 
ni +m -2 6 





Sample Statistics 


Group N Mean Std. Dev. Std. Error 
3x 4 1007.25 143.66 71.828 
TX 4 817.75 73.627 36.813 


Hypothesis Test 


Null hypothesis: Mean 1 ~ Mean 2 = 0 
ñlternative: Mean 1 - Mean 2 “= 0 
If Variances fire t statistic Df Pr >t 
Equal 2.348 5 0.0572 
Not Equal 2.348 4.47 0.0718 


95x Confidence Interval for the Difference between Two Means 


Lower Limit Upper Limit 











图 7. 10 混凝土 数据 的 SAS 描述 性 统计 量 和 置信 区 间 
是 合并 样本 方差 . 将 结果 代 人 得 所 求 区 间 为 





(1 007.25 -817.75) +2. a7, j3 028. 又 (元 ++) =189. 5 + 197. 50 


Ek — 8. 00 ~ 387. 00 (ik; 这 个 区 间 也 见 图 7.10. ) 区间 解 释 如 下 : 我 们 有 95% 的 信心 相信 区 间 
( -8.00, 387. 00) 包 含 了 两 类 沥青 混凝土 的 平均 渗透 性 之 差 的 真 值 . 由 于 区 间 包 含 了 0, 不 能 得 出 两 
个 平均 值 有 区 别 的 结论 . 

与 单个 样本 情况 一 样 , 对 于 区 间 估 计 , pi -pro 的 小 样本 估计 所 要 求 的 假定 不 必 严 格 满足 在 实际 
中 是 很 有 用 的 . 略微 偏离 这 些 假定 不 会 严重 影响 方法 的 置信 水 平 . 例如 ， 当 抽样 总 体 的 方差 o? 和 o 


A 
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不 相等 时 ,研究 发 现 只 要 两 个 总 体 是 正 态 的 并 且 样本 容量 相同 , 即 n, m n3, Rl -pw ) 的 小 样本 置 
信 区 间 的 计算 公式 仍 能 给 出 有 效 结果 . 

这 个 情况 就 发 生 在 例 7. 10 中 . 图 7. 10 给 出 的 样本 标准 差分 别 是 s = 143. 66 15, =73. 63. 因此 
总 体 方差 o1 和 o2 很 可 能 不 相等 3. 但 是 因为 n =n =4, MRH sf 和 总 (而 不 是 用 合并 的 样本 方差 
55) 作为 总 体 方差 的 估计 ,所 得 的 置信 区 间 的 结论 仍然 有 效 

"aiu o JE RL ni m 时 ,可 以 用 有 修正 自由 度 的 了 分 布 构造 (ui -jp ) 的 近似 置信 区 间 , 4 
BH si 代替 oi AE s2 E 02 即 可 . 这 些 修正 见 下 面 的 框 格 . 
ei o 时 (ji -p ) 的 小 样本 近似 推断 


为 了 得 到 or aa 时 ( -jw) 的 近似 置信 区 间 和 检验 ， 对 了 分 布 及 估计 的 标准 误 中 所 用 的 自由 度 进 
行 如 下 修正 : 














n =n, =n; v=n *n,-2-2(n-1) 0 s 5 oO t9) 
= (s1/n, + s1/n,)? ^ s osx 
n ën,; v= T; y = /一 + 一 
ME im) (sZ) "n nj, mn 
n, -1 n, -1 


注 : Š n. Z n, BF, p WE — OFE ER. # T k W k F 2k Ë y 为 最 接近 的 整数 . 
假定 : 1， 两 个 抽样 总 体 的 相对 频率 分 布 近似 正 态 . 
2. 两 个 随机 样本 是 从 目标 总 体 中 独立 抽取 的 . 











7. 37 高 强度 铝 合金 . 机 械 工程 师 已 经 研制 了 一 种 用 
于 反潜 艇 飞机 、 坦 克 和 远程 率 炸 机 的 新 的 高 强度 
HEE. (JOM, 2003 4E 1 A. ) 通 过 对 目前 最 大 强 
度 的 铝 合金 实施 反复 退化 和 老化 热处理 (RAA) 得 
到 这 种 新 的 高 强度 铝 合 金 , 进行 一 系列 的 强度 试 
验 来 比较 新 的 RAA 铝 合金 和 现 有 的 最 大 强度 的 钻 
合金 . 对 每 种 铝 合 金 抽 取 了 3 个 样品 , 测 得 它们 的 
强度 (MPa), 结果 汇总 在 下 表 . 


合金 类 型 


应 用 练习 

7.96 生物 完整 性 指标 . 俄亥俄 州 环境 保护 署 利 
用 生物 完整 性 指标 (IBI) 测量 一 个 水 域 的 生物 生 
存 条 件 和 健康 状况 . IBI 是 水 域 中 鱼 的 存活 、 含 
量 和 健康 指标 的 综合 . (IBI 值 较 高 表示 鱼 群 的 
健康 状况 较 好 . ) 研究 者 搜集 了 位 于 俄亥俄 州 不 
同 河 段 站 点 的 IBI 测量 值 . ( Journal of Agricultur- 
al, Biological, and Environmental Sciences, 2005 


年 6 月 ). 穆 斯 静 网 和 霍金 两 个 流域 的 汇总 数据 











列 在 表 中 . 利用 90% 置信 区 间 比 较 这 两 个 流域 RAA 现 有 
的 平均 IBI 值 . 样本 数 3 3 
流 R 样本 容量 均 值 标 准 2 平均 强度 ( MPa) 641.0 592.7 
EE E P 53 0.035 1.046 标准 差 19.3 12. 4 
霍金 51 0.340 0. 960 


资料 来 源 ; Boone, E. L., Keying, Y., and Smith, E. P. a 用 95% 置信 区 间 佑 计 两 种 铝 合金 的 平均 强 


"Evaluating the relationship between ecological and habitat 
conditions using hierarchical models. " Journal of Agricultural, 
Biological, and Environmental Sciences, Vol. 10, No. 2, 
June 2005 ( Table 1). 





O ”比较 两 个 总 体 方差 的 方法 见 7. 10 35. 


度 之 差 . 
b. 研究 者 断言 RAA 铝 合金 的 强度 超过 目前 最 大 强 
度 的 铝 合金 的 强度 . 你 同意 吗 ? 


7.88 专利 侵权 案件 . Chance (2002 年 秋 ) 描 述 了 一 
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N 


个 诉讼 案件 , 英特尔 公司 被 控告 侵犯 了 用 于 自动 PE. 推断 快 与 慢 肌肉 蛋白 质 吸收 平均 值 的 不 同 |. 
化 设备 的 计算 机 芯片 专利 . 为 了 回应 这 件 事 , 英 特 





快 肌肉 Ë 肌肉 
尔 控告 发 明 者 在 其 专利 被 批准 且 签 字 后 又 在 专利 n; = 12 n, = 12 
说 明 书 上 增加 了 材料 . 案件 的 关键 在 于 专利 证 人 的 y, 20.57 y, 20.37 
签名 是 在 说 明 书 主页 的 上 面 还 是 下 面 . 英特尔 聘请 s, =0. 104 5, =0. 035 


了 一 位 物理 学 家 , 他 用 X 射线 束 测量 了 证 书页 几 WARM: Ushio, H., and Watabe, S. “ Ultra- structural 
AF33 638 (AUER, EF PB) 的 有 关 浓 度 . 其 中 3 处 and biochemical analysis of the sarcoplasmic reticulum from 











(正文 行 、 证 示 行 和 正文 行 与 证 示 行 相交 处 ) 锌 的 crayfish fast and slow striated muscles. ” The Journal of Exper- 
MEFE. imental Zoology, Vol. 267, Sept. 1993, p. 16( Table 1). 
EG, os Q3- Qd 7.40 ”生产 过 程 中 的 电压 读数 . 参考 练习 2. 14, 哈里 
证 示 行 : 0.210 0.262 0.188 0.329 0.439 0.397 斯 有 限 公司 /佛罗里达 大 学 研究 确定 偏远 地 方 进行 
相交 处 : 0.393 0.353 0.285 0.295 0.319 的 制造 过 程 是 否 可 以 安置 在 本 地 . 在 新 、 旧 两 个 地 
NEN "m un 方 安装 了 试验 设备 (指示 器 ), 得 到 了 每 个 地 方 30 
Ë i "^ EM HEUEXATRAISUBZ MS 个 生产 运行 电压 读数 cac Bia sk eder. SUE 
qug t. A HES REBEL HE BL l ; Ss GR. 
b. 用 95% 的 置信 区 间 比 较 证 示 行 和 相交 处 之 间 锌 ”的 描述 性 统计 量 结果 见 后 面 的 SAS fifi. (2k. 电 
的 平均 测量 值 BAREEN ) 
c. 由 a WI b 的 结果 , 关于 3 处 锌 的 平均 值 , 你 能 得 旧地 方 新 地 方 
出 什么 结论 ? 998 10.12 984 | 9.19 1001 8.82 
d 为 使 推断 有 效 , 需要 什么 假定 ,它们 能 合理 地 10.26 10.05 10.15 | 9.63 8.82 8.65 
满足 中 ? ' ' 10.05 — 9.80 10.02 |10.10 9.43  &sl 
.39 肌肉 纤维 研究 . 东京 大 学 的 海洋 生物 化 学 家 研 10.29 10.15 9.80 | 9.70 10.03 9.14 
究 了 甲壳 动物 躯干 肌肉 的 特点 (Te Journal of Exper- 10.03 10.00 9.73 |10.09 985 975 
imental Zoology, 1993 年 9 月 ) 已 知 一 些 肌肉 收缩 805 — 9.87 10.01 | 960 9 z ^ ^ 
比 其 他 地 方 的 肌肉 快 . 这 次 实验 的 目的 是 比较 小 龙 1055 95 9 luo PEN 
虾 的 收缩 得 快 和 慢 肌肉 的 生物 化 学 性 质 . 试验 用 的 1026 995. 872 |10. i M 
小 龙虾 来 自 当地 供 货 者 , 抽出 12 条 快 肌肉 纤维 束 ， SU PTO 80 | 948 93 





龙虾 样本 抽出 12 条 慢 肌肉 纤维 束 , 并 且 测 量 它们 的 FATAI: Harris Corporation, Melbourne, Fla. 
Ca “吸收 值 . 试验 结果 整理 如 下 (所 有 Ca 以 每 之 a. 用 95% 和 车 信 区 间 比 较 两 个 地 方 的 平均 电压 读数 . 
区 的 摩尔 质量 度量 ) 用 95% 的 置信 区 间 分 析 这 些 数 hb 依据 a 的 结论 , 能 在 当地 建立 制造 厂 吗 ? 








Sample Statistics 


Group N Mean Std. Dev. Std. Error 
NEH 30 3.422333 0.4789 0.0874 
oLD 30 9.803667 0.5409 0.0988 


Hypothesis Test 


Nuli hypothesis: Mean 1 - Mean 2 = 0 
filternat ive: Mean | - Mean 2 ^- 0 
If Variances fre t statistic Df Pr >t 
Equal -2.831 58 0.0054 
Not Equal -2.891 57.18 0.0054 


30X Confidence Interval for the Difference between Two Means 


Lower Limit Upper Limit 
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.41 环 氧 修补 连接 的 应 力 . 新 设计 木材 结构 的 应 力 


分 析 方法 已 为 大 家 熟知 . 但 是 , 关于 修复 受 损 结 构 
的 实际 或 可 允许 的 应 力 数据 却 很 少 . 所 以 , 设计 师 
们 经 常 是 在 对 结构 有 效 性 能 一 无 所 知情 况 下 提出 修 
补 方案 (如 粘 补 ). 为 了 部 分 地 填补 这 个 空白 , 提出 
一 种 环 氧 修补 捆扎 连接 的 应 力 分 析 ( Journal of Struc- 
tural Engineering, 1986 年 2 月 ). 对 各 种 不 同 的 木材 
进行 拥 所 连接 实验 以 确定 实际 的 胶水 烙 合 切断 应 
J, 单位 是 Min". 南方 松 和 西 黄 松 做 的 捆扎 连接 独 
立 随 机 样本 数据 见 下 表 . 用 90% 的 置信 区 间 估 计 两 
种 松木 的 环 氧 拥 扎 连接 的 平均 切断 强度 之 差 . 





南方 松 西 黄 松 
样本 容量 100 47 
平均 切断 应 力 1 312 1 352 
标准 差 l 422 271 





资料 来 源 : Avent, R. R. “Design criteria for epoxy repair of 
timber structures. ” Journal of Structural Engineering, Vol. 
112, No. 2, Feb. 1986, p. 232. 


. 42 森林 入 口 通道 的 特征 . 在 爱尔兰 , 主要 的 商用 


木材 都 生长 在 遥远 的 泥 煤 土 层 带 . 当 有 采伐 车 辆 或 
其 他 重型 卡车 通过 时 ,这 些 公路 很 快 就 会 损坏 . — 
项 关于 爱尔兰 森林 入 口 通道 的 特征 研究 发 表 在 In- 
ternational Journal of Forest Engineering ( 1999 年 7 
A). 路 面 强度 的 一 个 度量 是 瞬 变 的 表面 重度 一 
表面 垂 度 越 大 ,路 面 越 差 . 确定 了 72 条 森林 入 口 
通道 的 路 面 类 型 (矿石 路 基 或 泥 煤 路 基 ) ， 然 后 分 
析 它 们 的 表面 垂 度 (mm)， 结果 汇总 在 表 中 . 用 
95% 的 置信 区 间 比 较 两 种 路 基 , 矿石 路 基 和 泥 煤 路 








基 中 哪个 更 坚固 ? 
一 一 一 一 
道路 路 基 
矿石 泥 煤 
公路 数量 32 40 
平均 表面 重度 1.53 3. 80 
标准 差 3.39 14.3 


资料 来 源 : Martin, A. M., 
ability of forest access roads. "International Journal of Forest En- 
gineering, Vol. 10, No.2, July 1999( adapted from Table 3). 


et al. “Estimation of the service- 


7.6 两 个 总 体 均 值 差 的 估计 : 配对 
7.5 节 介绍 的 估计 两 个 总 体 均值 之 差 的 大 样本 与 小 样本 方法 都 假定 样本 是 随机 、 独立 地 取 自 目 


标 总 体 ， 有 时 选取 成 对 观测 能 够 得 到 关于 总 体 均 值 差 (1 


7. 


N 


43 MENO. 以 色 列 农业 专家 发 明了 一 种 新 的 灌 
溉 法 一 一 滴灌 施肥 法 . 这 种 方法 就 是 把 化 肥 加 在 水 
中 定期 地 将 混合 物 滴 流 到 植物 的 根部 . 这 样 水 (在 
以 色 列 非常 珍贵 ) 很 少 被 浪费 , 而 且 营 养 直接 进入 
植物 生长 需要 的 地 方 . 为 了 验证 这 种 新 方法 的 有 效 
性 , 随机 抽取 100 块 地 ,记录 它们 的 历史 产量 , 然 
后 对 新 的 作物 用 滴灌 施肥 法 , 记录 新 的 产量 , 结果 
汇总 在 下 表 . 





滴灌 施肥 前 滴灌 施肥 后 
样本 容量 100 100 
平均 产量 40% 75% 
标准 差 8% 6% 


a. 用 90% 和 置信 区 间 估 计 滴 灌 施肥 前 后 平均 产量 真 
值 之 差 . 
b. 解释 a 中 置信 区 间 的 含义 . 


. 44 将 粉末 变 成 国体 . 烧结 一 一 材料 科学 的 最 重要 


的 技术 之 一 , 是 将 粉 状 物质 变 成 孔 状 固体 . 下 面 两 
个 度量 刻画 了 最 终 产 品 : 
V, = 最 终 产 品 中 固体 物 总 体积 的 百分比 





= Ecr 65721 "100 


Sy = 产品 的 每 单位 体积 的 固体 一 气孔 界面 面积 

4 V, =100% 时 , 产品 完全 是 固体 的 , 即 没有 气孔 . 通 
过 显微镜 检测 烧结 材料 的 光滑 截面 估计 V, 和 S, 的 
值 下 表 给 出 了 两 种 不 同 烧结 时 间 的 100 个 烧结 镍 样 
品 的 Sy Cem" /cm' ) 和 (百分数 ) 的 均值 和 标准 差 . 
一 一 一 ”一 








S, Vy 
时 间 (min) - - 
$ y s 
10 736.0 181.9 96. 73 2.1 
150 299. 5 161.0 97.82 1.5 


He: 数据 与 试验 信息 由 刘 国 权 (音译 ) 在 1983 AE 

里 达 大 学 时 提供 的 . 

a. 3R 10 min 和 150 min 烧结 时 间 的 S, 平均 变化 的 
95% 置 信 区 间 . 对 这 个 平均 值 之 差 , 你 有 什 
么 推断 ? 

b. 对 V, E£ a. 


-Ha ) 的 更 多 信息 . 


例如 , 假定 比较 两 种 干燥 混凝土 的 方法 , 每 种 方法 选取 5 个 水 泥 混 合 物 样品 . 一 种 抽样 方法 是 从 
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所 有 的 有 效 混合 物 中 随机 选取 10 个 混合 物 ( 记 为 A, B, C, D, =, J), 然后 随机 指派 5 个 用 方法 1 
TR, 另 5 个 用 方法 2 干燥 ( 见 表 7.5). 通过 一 系列 的 强度 试验 得 到 强度 测量 值 , 这 样 就 提供 了 两 种 
不 同 于 燥 方法 的 混凝土 样品 强度 独立 随机 样本 . 平均 强度 测量 值 之 差 (j, -ja ) 可 用 7.5 节 介 绍 的 置 
信 区 间 的 方法 估计 . 

一 个 更 好 的 抽样 方法 是 根据 混凝土 的 类 型 将 混凝土 样品 配对 . 从 每 一 对 中 随机 选取 一 个 样品 采 
用 方法 1 干燥 ; 而 对 另 一 个 样品 采用 方法 2 干燥 , 见 表 7.6. 配对 强度 测量 值 之 差 清晰 地 描述 了 两 种 
干燥 方法 的 差别 ， 因 为 配对 使 得 形成 配对 的 基础 因子 效应 ( 对 不 同 的 水 泥 混合 物 效 应 ) 消失 。 














表 7. 5 指派 给 每 种 方法 的 表 7.6 比较 两 种 干燥 混凝土 方法 

水 泥 混合 物 的 独立 随机 样本 的 配对 设计 方案 
方法 1 方法 2 混合 物 类 型 方法 1 方法 2 
RAH A 混合 物 B A ña 2 样品 1 
RAHE 混合 物 C B 样品 2 样品 1 
混合 物 了 混合 物 D C 样品 1 样品 2 
REH H 混合 物 C D 样品 2 样品 1 
混合 物 J RAHI E 样品 1 样品 2 





在 配对 试验 中 , 用 符号 wu 表示 配对 平均 测量 值 之 差 , 其 中 j = (Qu -jp ). 一 旦 样本 之 差 计算 出 
来 , pa 的 置信 区 间 等 价 于 7. 4 节 单 个 总 体 均值 置信 区 间 . 
下 面 方 框 给 出 基于 配对 数据 , 估计 两 个 总 体 均值 之 差 的 大 样本 与 小 样本 方法 . 


Au = (Ai -Hz) 的 (1-w)100% EERE: 配对 
次 看， 中，…，d 表示 nn 个 配对 随机 样本 中 成 对 观测 值 之 差 ,8 =n 个 样本 差 的 平均 ，s, =n NERAN 
标准 差 . 
































大 样本 小 样本 
j Cu 2 Sa 
d £z, 一 dtt,4| — 
o) (5 
中 o, 是 差 的 总 体 标 准 差 š 中 ty 的 自由 度 是 (n 一 1) 
RÈ: n=30 假定 : 配对 差 的 总 体 是 正 态 分 布 








注 ; 当 cu 未 知 时 (通常 是 这 种 情况 ), 用 ss 近似 og 





CAN 水 管 的 一 个 合乎 需要 的 特性 是 经 水 管 输 送 的 水 质量 等 于 或 接近 于 在 水 处 理 广 进入 系统 时 
的 水 质量 ,一 种 锻 铁 管 为 圣路易斯 县 水 公司 提供 了 很 好 的 水 输送 系统 . 测量 了 南方 水 处 理 厂 和 消防 
MOLAK 13 号 ) 流出 的 水 含 毛 量 , 共 12 个 月 的 数据 , 见 表 7. 7. 求 这 两 个 地 方 水 中 月 含 氧 量 的 平均 
3 Bg 95% 置信 区 间 . 
BE 由 于 这 两 个 地 方 水 的 氯 含量 是 在 相同 的 12 个 月 里 记录 的 , 数据 是 配对 收集 的 . 我 们 需要 估 

iua = (u -Az)， 其 中 

Ai = 南方 厂 的 月 平均 氯 含量 

m= 消防 队 的 月 平均 氯 含量 
配对 的 月 平均 毛 含 量 之 差 计算 如 下 ， 


3 
a 
地 
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4=( 南 方 三 含量 ) - (消防 队 含量 
结果 见 表 7.7 的 最 后 一 行 . 
表 7.7 例 7. 11 的 氯 含 量 数据 








H B 
1 月 2 月 3 月 4H 5 B 6 H 7 月 8 H 9 月 10 H 11 月 12 H 
地 点 南方 厂 ”2.0 2.0 2.1 1.9 1.7 1.8 1.7 1.9 2.0 2.0 2.1 2.1 
消防 队 2.2 2.2 2.1 2.0 1.9 1.9 1.8 1.7 1.9 1.9 1.8 2.0 
E3 -0.2 -0.2 0 -0.1 -0.2 -0.I -0.1 0.2 0.1 0.1 0.3 0.1 


资料 来 源 ;“St. Louis County Standardizes Pipe and Procedures for Reliability. ” Staff Report, Water and Sewage Works, Dec. 1980. 


由 于 样本 容量 n=12 比较 小 , 为 了 得 到 置信 区 间 ， 必须 假定 这 些 差 来 自 近 似 的 正 态 分 布 . 这 些 样 
本 差 的 均值 和 标准 差 见 图 7. 11 的 SPSS 输出 . 由 这 些 结果 得 d= -0. 0083, s, =0. 1676. 
由 表 B.7 可 得 , H Hi RE (n - 1) 2 (12-1) 2-11 的 to. 025 的 值 为 to.025 = 2. 201. 将 这 些 值 代入 小 
样本 置信 区 间 公 式 , 得 到 
dtto o| Z) = -0. 0083 +2. x” 
` Wn, 12 
或 者 ( -0.115, 0.098). (È; 这 个 区 间 也 显示 在 图 7. 11. ) 


Paired Samples Statistics 


Std Std. Error 

Mean N Deviation Mean 
Pair SPLANT 1.942 12 .1443 0417 
1 FSTATION 1.980 12 1567 .0452 


Paired Samples Correlations 


| | x Teoman L sa] 
Parl "SPLANT &FSTATION 22i 


Paired Samples Test 


| = -0. 0083 «0. 1065 




























Paired Differences 








T 
95% Confidence | 


Interval of the 
- Difference 
Lower | Upper | t 


-4149. 0982 














Std Std. Error 
Deviation | Mean 
.1676 0484 









Mean 
-.0083 














Sig. (2-tailed) 


Pair 1 SPLANT - FSTATION 866 





图 7.11 AAEH SPSS 描述 性 统计 量 和 配对 置信 区 间 


我 们 以 95% 的 置信 估计 圣路易斯 两 个 地 方 水 中 氯 含量 的 月 平均 值 之 差 落 在 -0.115 ~ 0. 098 之 
间 的 区 间 内 . 因为 这 个 区 间 包 含 0， 所 以 没有 足够 的 证 据 认为 两 个 平均 值 存在 差别 . | 

在 配对 数据 的 分 析 中 , 需要 强调 的 是 ， 试验 单位 (进行 测量 的 对 象 ) 的 配对 必须 在 收集 数据 之 前 
完成 . 前 面 已 经 说 明 目 的 是 比较 “处 理 " 试 验 单位 的 两 种 方法 ， 通过 利用 具有 相似 特性 的 单位 配对 ， 
可 以 抵消 用 于 配对 的 变量 的 影响 . 


应 用 练习 进行 了 用 安全 带 ( 有 约束 条 件 ) 和 无 安全 带 (无 约束 条 
7.45 司机 反应 时 间 研究 . 联邦 交通 安全 研究 人 员 受命 TE) 下 的 模拟 驾驶 , 并 记录 下 反应 时 间 . 因此 , 每 个 受 


试 者 得 到 了 两 个 反应 时 间 得 分 ,个 是 约束 条 件 下 
ed 


应 时 间 的 影响 . 为 了 研究 这 个 问题 , 从 注册 驾驶 员 培 表 , SPSS 的 分 析 输 出 在 后 面 给 出 . 
训 的 学 生 中 随机 选取 了 15 个 受 试 者 . 让 每 个 受 试 者 都 a. 求 约束 条 件 和 无 约束 条 件 司机 平均 反应 时 间 之 
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差 的 9%% 置 信 区 间 ，. 
b. 为 使 a 中 估计 的 区 间 有 效 , 必须 的 假定 是 什么 ? 


驾驶 员 1 2 3 4 5 6 


c. 根据 a 中 计算 的 置信 区 间 , 你 对 不 同 驾 驶 条 件 
下 的 平均 反应 时 间 有 什么 推断 ? 


8 9 10 11 12 13 14 15 





7. 


N 


ZW 36.7 37.5 39.3 44.0 38.4 43.1 
无 约束 36.1 


36.2 40.6 34.9 31.7 37.5 42.8 32.6 36.8 
35.8 38.4 41.7 38.3 42.6 33.6 40.9 32.5 30.7 37.4 40.2 33.1 


38.0 


33.6 37.5 


Paired Samples Statistics 


std Std. Error 
Deviation Mean 





Pair ^ REAC R 
1 REAC U 





Paired Differences 


3.5756 9232 
3.6197 .9336 





Std. Std. Error 
Mean Deviation Mean 





90% Confidence 
Interval of the 
Difference 








Pair1 REAC R- REAC U 1.1800 1.1906 3074 .6386 1 EID T5 


练习 7. 45 的 SPSS 输出 


46 检测 电子 电路 . 日 本 研究 人 员 利 用 赫 夫 曼 编 码 
开发 了 检测 电子 电路 的 压缩 / 降 压 方法 . (IEICE 
Transactions on Information: & Systems, 2005 4E 1 
月 . ) 设 计 这 种 新 方法 是 为 了 减少 非 压缩 输入 和 压 
缩 输出 ( 称 作 压缩 比 ) 所 要 求 的 时 间 . 选取 了 来 自 
SUN Blade 1 000 个 工作 站 中 的 11 条 基准 线路 (大 
小 不 同 ). 用 标准 的 压缩 / 降 压 方法 和 新 的 赫 夫 曼 编 
码 方法 检测 每 一 条 线路 , 得 到 它们 的 压缩 比 数据 ， 
数据 见 附 表 . 用 9%5 多 置信 区 间 比 较 这 两 种 方法 , 哪 





一 种 方法 有 较 小 的 平均 压缩 比 ? 
线 路 标准 方法 赫 夫 曼 编码 法 
I 0.80 0.78 
2 0.80 0.80 
3 0.83 0.86 
4 0.53 0.51 
5 0.50 0.51 
6 0.96 0. 68 
7 0.99 0. 82 
8 0. 98 0.72 
9 0.81 0.45 
10 0.95 0.79 
11 0.99 0.77 





资料 来 源 : Ichihara, H. , Shintani, M. , and Inoue, T. “Huff- 
manbased test response coding. " IEICE Transactions on. Infor- 
mation & Systems, Vol. E88-D, No. 1, Jan. 2005 (Table 3). 


47 JH —ERERS.UEIKImIqeaEmm 
药 会 导致 无 意 的 大 范围 空气 污染 .Environmental 
Science & Technology( 1993 年 10 月 ) 报告 了 在 加 里 
福 尼 亚 州 圣 杰 晶 山谷 的 休眠 果园 里 喷洒 二 嗪 农 对 空气 


造成 的 污染 . 在 一 个 果园 喷洒 农药 最 集中 的 日 子 里 ， 
选取 11 天 的 空气 样本 . 记录 了 白天 和 晚上 空气 中 的 二 
嗪 农 残留 水 平 (mg/m ) , 见 附 表 . 研究 者 想 知道 , 白天 
和 晚上 的 二 嗪 农 平均 残留 水 平 是 否 不 天 








— E 

日 其 ZERIE 
白天 晚上 
1 月 11 日 5.4 24.3 
12 2.7 16.5 
13 34.2 47.2 
14 19.9 12.4 
15 2.4 24.0 
16 7.0 21.6 
17 6.1 104.3 
18 7.7 96.9 
19 18.4 105. 3 
20 27.1 78.7 
21 16. 9 44. 6 





资料 来 源 : Selber, J. N., 
for organophosphate insecticides used on dormant orchards in the 
San Joaquin Valley, California. " Environmental Science & Tech- 
nology, Vol. 27, No. 10, Oct. 1993, p. 2240( Table IV). 


a. Hj 90% 置信 区 间 分 析 数 据 . 
b. 为 使 a 的 区 间 估 计 方 法 有 效 , 必要 的 假定 是 什么 ? 
c. 利用 a 的 区 间 回 答 研 究 者 的 问题 . 


et al. " Air and fog deposition residues 


.48 日 光照 射 研究 .Jorrnal of Environmental Engi- 


neering(1986 年 2 月) 报告 了 一 个 用 来 预测 污水 处 理 
净化 器 冬季 热量 损失 的 热传导 模型 . 该 项 研究 涉及 
了 中 西部 地 区 不 同 地 方 的 地 平面 晴天 日 光照 射 水 平 
的 比较 . 测量 了 中 西部 地 区 不 同 纬度 两 个 地 方 ( 密 苏 
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N 


里 的 圣 约 琴 和 衣 阿 华 大 湖 地 区 ) 的 全 天 日 光照 射 水 
平 (BTU/sg， ft). 对 每 个 地 方 记录 冬季 7 个 晴天 的 水 
FE, 数据 见 附 表 . 求 两 个 地 方 冬季 睛 天 的 全 天 日 光 
照射 水 平平 均 差 的 95% 置信 区 间 . 解释 所 得 结果 . 


行驶 , 头 部 撞 向 固定 的 障碍 物 . 对 98 辆 新 车 进行 了 
碰撞 测试 , 数据 保存 在 NHTSA 文件 中 , 数据 集合 
中 每 辆 车 的 两 个 变量 测量 值 是 (1 ) 司机 胸部 受伤 的 
严重 程度 和 (2) 乘 客 胸部 受伤 的 严重 程度 ( Bg UE 
撞 的 点 数 越 多 , 受伤 越 严重 ). 假设 NHTSA 想 确 定 





日 期 EHE 衣 阿 华 大 湖 地 区 
12 月 21 日 782 593 
1 月 6 日 965 672 
1 月 21 日 948 750 
2 月 6 日 1 181 988 
2 月 21 晶 1414 1 226 
3 月 7 日 1 633 1 462 
3 月 21 日 1 852 1 698 


资料 来 源 : Wall, D. J., and Peterson, G. “ Model for winter 
heat loss in uncovered clarifiers. " Journal of Environmental En- 
&ineering, Vol. 112. No. 1, Feb. 1986,p. 128. 


49 ”低频 声音 暴露 . 次 声 是 一 种 低 于 人 耳 听 力 范 围 
的 声波 或 震动 . 尽管 次 声 听 不 到 ， 但 它 能 对 人 产生 
生理 影响 . 我 国 的 机 械 科 学 工程 师 研 究 了 次 声 对 人 
血压 和 心率 的 影响 ( Journal of Low Frequency Noise, 
Vibration and Active Control, 2004 年 3 月 ). 6 名 大 学 
生 暴露 在 次 声 1 h, 表 中 给 出 了 每 名 学 生 的 血压 和 心 
跳 数据 . 每 一 组 数据 都 包含 了 暴露 前 后 的 测量 值 . 
”| pE | ig 
L. ( mmHg) (心跳 /分 钟 ) 
学 生 前 后 前 后 前 后 





1 105 118 60 73 70 70 
2 113 129 60 73 69 80 
3 106 117 60 79 76 84 
4 126 134 79 86 77 86 











5 113 115 73 66 64 76 
资料 来 源 : Qibai, C. Y. H. , and Shi, H. “An investigation 
on the physiological and psychological effects of infrasound on 
persons. " Journal of Low F. requency Noise, Vibration and Active 
Control, Vol. 23, No. 1, Mar. 2004 ( Table V). 


a. 用 99% 置 信 区 间 比 较 前 后 平均 收缩 压 读数 . 并 
解释 所 得 结论 . 

b. 用 9%9% 置 信 区 间 比 较 前 后 平均 扩张 压 读数 .并 
解释 所 得 结论 . 

e. 用 99% 置 信 区 间 比 较 前 后 平均 心率 读数 . 并 解 
释 所 得 结论 . 


90 NHTSA 新 车 碰撞 测试 . 每 年 美国 国家 高 速 公 


路 交通 安全 管理 局 (NHTSA ) 都 要 进行 新 车 碰撞 测 
试 ， 碰撞 的 假 人 放置 在 一 辆 新 车 模型 的 驾驶 座 和 前 
排 乘客 座 . 这 辆 车 由 遥控 驾驶 ,以 35 mile/h 的 速度 


司机 胸部 受伤 等 级 的 平均 值 是 否 超 过 乘客 受伤 等 

级 的 平均 值 . 如 果 是 , 超出 量 是 多 少 . 

a. 描述 NHTSA 关心 的 参数 . 

b. 解释 为 什么 必须 用 配对 方法 分 析 这 批 数据 . 

e. 求 司机 和 前 座 乘客 胸部 受伤 等 级 的 平均 真 值 之 
3E 89 99% Erf Ix ji. 

d. 解释 c 的 置信 区 间 , 司机 胸部 受伤 等 级 的 均值 
真 值 超过 乘客 胸部 受伤 等 级 的 均值 真 值 吗 ”如 
RE, 超出 量 是 多 少 ? 

e. 为 使 分 析 有 效 , 需要 满足 哪些 条 件 ” 这 批 数 据 

满足 这 些 条 件 吗 ? 


O91 酒 中 的 酒精 发 酵 , 在 酿酒 过 程 中 确定 酒精 发 本 


是 关键 . 因为 当 糖 转化 为 酒精 时 , 密度 值 就 降低 ， 所 
以 葡萄 酒 密度 值 是 一 个 好 的 发 酵 点 指标 . 几 十 年 以 
K, 酿酒 者 用 液体 比重 计 测 量 葡萄 酒 密度 . 尽管 测 
量 准确 , 但 是 液体 比重 计 的 人 工 操作 非常 费时 . 所 
以 , 大 的 酿酒 三 正在 努力 寻找 比较 快速 的 密度 检测 
方法 . 一 种 方法 是 利用 流体 静 力 学 平衡 仪 ( 类 似 液体 
比重 计 , 是 数字 型 的 ) 葡萄 牙 的 一 家 酿酒 厂 测量 了 
从 最 近 收 获 期 发 酵 过 程 中 随机 抽取 的 白 葡萄 酒 中 样 
本 , 得 到 了 葡萄 酒 密度 测量 值 .对 每 -次 抽样 ,用 液 
体 比重 计 和 流体 静 力学 平衡 仪 两 种 方法 测量 它们 在 
20 时 的 白 葡萄 酒 密度 值 . 40 个 白 葡萄 酒 样本 的 密 
度 值 保存 在 WINEAO 文件 中 . (前 5 个 和 后 5 个 测量 
值 列 在 下 面 表 中 ). 只 当 两 种 方法 密度 测量 值 的 均值 
之 差 不 超 过 0. 002 时 , 酿酒 厂 才 会 选用 另 一 种 方法 
进行 测量 . 为 酿酒 厂 作出 分 析 并 给 出 你 的 建议 . 





样 本 比重 计 平衡 仪 
1 1. 086 55 1.091 03 
2 1. 002 70 1. 002 72 
3 1.013 93 1.012 74 
4 1. 094 67 1. 096 34 
5 1. 102 63 1.105 18 

36 1.080 84 1. 080 97 
37 1.094 52 1. 094 31 
38 0. 994 79 0. 994 98 
39 1. 009 68 1. 010 63 
40 1.006 84 1. 005 26 


资料 来 源 : Cooperative Cellar of Borba( Adega Cooperative de 
Borba) , Portugal. 
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7.7 总 体 比 率 的 估计 


现在 考虑 二 项 分 布 中 成 功 比率 P( 即 总 体 中 具有 某 种 特征 的 元 素 比率 ) 的 估计 方法 . 例如 , 质量 
控制 检查 员 可 能 关心 装配 线 上 生产 的 不 合格 品 比率 , 或 者 燃油 供应 商 可 能 关心 他 的 服务 区 内 使 用 天 
然 气 用 户 的 比率 . 

总 体 比率 符合 逻辑 的 候选 点 估计 是 样本 比率 方 = yn, 其 中 y 是 容量 为 n 的 样本 中 具有 所 关心 
特征 的 观测 次 数 ( 即 随机 变量 y 是 二 项 试验 中 “成 功 ”的 次 数 ). 在 例 6.23 中 我 们 证 明了 对 较 大 的 n, 
b 近似 正 态 分 布 ,均值 为 : 

E(p) =p 
方差 为 ; 
yg» =" 


因此 , p 是 p 的 一 个 无 偏 估计 且 ( 证 明 略 ) 在 所 有 无 偏 估计 中 具有 最 小 方差 ， 即 了 是 p 的 MVUE. 因为 是 近 
似 正 态 的 , 所 以 可 以 用 它 作为 枢 轴 统 计量 , 利用 定理 7.2 导出 p 的 大 样本 置信 区 间 公 式 , 见 下 面 的 框 格 





总 体 比率 p 的 大 样本 (1 -oa)100% 置信 和 区间 


^ — pq 
Ptz0 =P E Zyn q | n 


其 中 是 所 关心 特征 的 样本 观测 比率 , ¿= 1 - p. 
(Ri 因为 对 中 我 们 必须 将 样本 的 六 和 9 代替 相应 总 体 值 ， 所 以 区 间 是 近似 的 ，) 

假定 : 样本 容量 n 必须 充分 大 ,使得 近似 是 有 效 的 一 个 经 验 法 则 是 ,如 果 n4 Engs, 则 认为 充 
分 大 的 样本 容量 条 件 满足 . 














注意 必须 将 样本 值 了 和 4 代入 公式 os = /pa/n 来 构造 置信 区 间 . 所 以 只 要 样本 容量 足够 大 ,这 
种 近似 就 有 效 . 许多 研究 者 采用 经 验 法 则 ,如果 区 间 户 +2VB5jm 不 包含 0 或 1, n 就 算 足 够 大 .回忆 
(6.10 节 ) 如 果 np>4 H nq>4, 这 种 法 则 是 满足 的 . 
LEAD 化 工厂 经 常用 不 锈 钢 处 理 腐蚀 性 液体 , 但 是 , 这 些 不 锈 钢 在 某 种 环境 下 特别 受到 应 力 府 
R. 发 生 在 日 本 炼油 厂 和 石油 化 学 制品 厂 的 295 个 合金 钢 失效 样本 中 , 有 118 个 是 由 于 应 力 府 
PRB R S RE DIOREAS 3 [EO ( Materials Performance, 1981 年 6 月 ). 构造 由 应 力 腐蚀 断裂 引起 的 合 爹 钢 
失效 比率 真 值 的 95% 置信 区 间 . 

解 由 腐蚀 引起 的 合金 钢 失效 的 样本 比率 为 ; 


; ~ 样本 中 由 腐蚀 引起 的 合金 钢 失效 数 118 _ 
P 样本 中 合金 钢 失 效 总 数 295 = 


因此 , 9 =1-0.4=0.6. 近似 95% 告 信 区 间 是 ; 


P + Zo. 025 [F4 -0.4 +1.96 0-00-60) 0.4 20. 056 


或 者 (0.344, 0.456). (注意 因为 成 =118 B. n ë =177 都 超过 了 4, 所 以 近似 是 有 效 的 . ) 
我 们 有 95% 的 信心 认为 0.344 ~0.456 的 区 间 包 含 了 由 腐蚀 引起 的 合金 钢 失 效 比率 的 真 值 . 如 果 
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我 们 重复 地 随机 选取 n=295 个 合金 钢 失效 样品 , 并 且 对 每 次 抽样 构造 95% 置信 区 间 , 那么 我 们 期 户 


构造 的 置信 区 间 有 95% 包含 了 jp. 


存在 总 体 比率 p 的 小 样本 估计 . 估计 方法 类 似 于 总 体 均 值 j 的 小 样本 估计 . (EZ p = yn 可 以 看 
成 0-1 伯 努 利 试验 的 样本 均值 . ) 这 里 就 不 再 详细 讨论 , 但 由 于 实际 中 大 部 分 情况 用 到 的 样本 都 足够 


K, 所 以 可 以 用 本 节 介绍 的 方法 . 
应 用 练习 


7.92 司机 使 用 手机 . 2001 年 7 月 的 研究 报告 中 , 美 
国运 输 部 报告 了 本 国 届 民 安 全 消费 调查 , 调查 的 
一 个 焦点 是 司机 在 驾驶 客运 车 辆 时 使 用 手机 的 状 
Di. 调查 者 随机 选取 了 一 个 交 义 路 口 收集 所 需 数 
据 . 结果 在 1 165 名 司机 中 有 35 名 正在 打 电 话 . 

给 出 司机 使 用 手机 比率 p( 即 驾驶 中 使 用 手机 局 

机 的 比率 真 值 ) 的 点 估计 . 

b. 计算 p 的 95% 置信 区 间 . 

c A b 中 置信 区 间 的 实际 解释 . 

58 地 下 水 中 的 砷 .Epoironmenial Science & Tech- 

nology(2005 年 1 月 ) 报 告 了 检测 地 下 水 中 砷 的 商 

用 仪器 可 靠 性 研究 结果 . 用 这 套 仪器 测量 T i Jn dr 

国 328 HHB F JEZK, "n COR 03 EN € EXC LZ. 

E, 水 中 砷 的 含量 估计 至 少 为 50 ug/L; 如 果 颜 色 

呈现 绿色 , 水 中 砷 的 含量 估计 在 50 ug/L AF. 此 

项 研究 的 数据 保存 在 ASWELLS 文件 中 . 砷 测试 结 

果 汇 总 见 下 面 MINITAB 输出 . 利用 这 些 信息 求 孟 

加 拉 国 所 有 地 下 水 井中 砷 含量 估计 在 50 pg/L 以 下 

的 水 井 真实 比率 的 90% 置信 区 间 . 给 出 这 个 区 间 的 








a. 


N 





Tally for Discrete Variables: KIT-COLOR 


KIT-COLOR 
Green 

Red 

N= 


Count Percent 
178 54.27 
150 45.73 
328 











练习 7. 53 的 MINITAB 输出 


3.75 4. 05 3.81 3.23 3.13 3.30 


4. 06 4. 56 3. 60 3.27 4. 09 3.38 


资料 来 源 ; Adapted from American Journal 


7.57 气 袋 对 儿童 的 威胁 . 依照 法 律 , 所 有 新 车 必须 
安装 驾驶 座 和 乘客 座 的 安全 气 袋 . 但 是 , 我 们 关心 
的 是 这 些 气 锥 是 否 会 对 坐 在 乘客 座 的 儿童 构成 威 
胁 . 在 美国 国家 高 速 公 路 交通 安全 局 (NHTSA ) 的 
一 项 研究 中 , 55 个 由 气 袋 爆炸 压力 致死 的 人 中 , 有 


3. 21 


3. 37 


7.54 物质 安全 数据 表 . 20 年 来 , 美国 居民 安全 和 健 
康 管理 部 一 直 要 求 拥有 危险 化 学 品 的 企业 完成 他 
们 的 物质 安全 数据 表 ( MSDS). 由 于 这 些 MSDS 很 
难 被 工人 理解 与 完成 ,因而 受到 责难 . 尽管 在 1990 
年 作 了 修订 , 但 最 近 对 150 张 MSDS 的 研究 表明 ， 
满意 完成 的 只 有 11%. ( Chemical & Engineering 
News, 2005 年 2 H 7 日 . ) 求 满意 完成 MSDS 百分比 
的 95% 置信 区 间 . 

.55 拥有 商业 网 站 的 承包 商 . 每 一 年 , 美国 建筑 承 
包 商 和 设备 销售 商都 要 参加 CIT 建筑 行业 预测 的 调 
Æ. 2004 年 , 有 900 名 承包 商 参 加 了 这 项 调查 , 其 中 
414 名 表示 他 们 或 者 已 经 拥有 商业 网 站 或 者 计划 到 
2005 年 年 底 拥 有 ( Contractor Magazine, 2005 年 1 
月 ). 

用 这 个 调查 信息 求 到 2005 年 年 底 美 国 拥有 商业 

网 站 的 承包 商 的 真实 比率 的 点 估计 . 

b. 用 90% 置信 区 间 , 求 a 中 比率 的 区 间 估 计 . 

给 出 b 的 区 间 估 计 的 实际 意义 , 你 的 回答 应 该 

以 “我 们 有 90% 的 置信 ”开头 . 





a. 


c. 


d. 解释 “90% 的 置信 ”的 意义 . 
7.56 bibe SS EN. 参考 练习 2.20, American 


Journal of Science (2005 4E 1 月 ) 对 威斯康星 州 沉积 

KIIKE RIKTAD) 的 化 学 构成 研究 . 26 PIRR 

冰 厂 样品 中 铝 和 针 的 比率 在 下 面 的 表 中 . 

a. 回忆 研究 者 希望 估计 冰 矿 物 中 锅 和 猴 的 比 超过 
4.5 的 比率 . 利用 样本 数据 计算 这 个 估计 值 . 

b. 围绕 a 的 估计 值 , 构造 95% 署 信 区 间 . 并 解释 这 


个 区 间 . 
3.32 409 390 50 3.85 3.88 
273 295 225 2723 255 3.06 


of Science, Vol. 305, No. 1, Jan. 2005, p. 16 (Table 2). 


35 ^J ^h TE BE HESIE AE Rey E BU JL 3. ( Wall Street 
Journal, 1997 4E 1 H 22 H. ) 这 项 研究 使 一 些 有 小 
该 的 车 主将 乘客 座 的 气 袋 拆 除 . 考虑 所 有 已 经 确定 
是 气 袋 致死 的 伤亡 交通 事故 , S p 表示 涉及 坐 在 前 
排 乘 客座 小 孩 的 事故 比率 真 值 . 
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a. 用 NHTSA 的 研究 数据 估计 p. 

b. 构造 p 的 99% 置信 区 间 . 

c. 解释 b 的 区 间 估 计 意 义 . 

d. NHTSA 的 研究 者 认为 35 个 由 气 袋 致死 的 小 孩 
中 有 24 个 是 由 于 没有 系 安全 带 或 看 管 不 严 造成 
的 ,这 个 信息 对 你 关于 气 袋 致命 风险 的 评估 有 
何 影响 ? 

7.58 混凝土 建筑 物 . 作为 美国 和 日 本 合作 研究 协议 
的 一 部 分 , 在 模拟 日 本 地 震 负荷 下 , 设计 并 试验 全 
部 钢筋 混凝土 建筑 物 ( Journal of Structural Engineer- 
ing, 1986 年 1 H). 作为 研究 的 一 部 分 , 一些 美国 
设计 工程 师 要 求 对 这 项 新 设计 作出 评价 . 调查 了 48 
位 工程 师 , 有 36 位 认为 结构 的 剪 墙 加 固 太 轻 . 求 
认为 建筑 物 的 剪 墙 加 固 太 轻 的 美国 设计 工程 师 的 
比率 真 值 的 95 多 置信 区 间 . 


7.59 宇航 员 的 定向 提示 . 宇航 员 经 常 报 告 当 他 们 在 


没有 引力 的 宇宙 飞船 走动 时 不 能 辨别 方向 . 作为 补 
偿 ， 宇 航 员 们 费劲 地 依靠 视觉 信息 建立 起 上 一 下 
定向 . 一 个 经 验 研究 是 评估 利用 颜色 的 明亮 度 作为 
身体 定向 提示 的 可 能 性 (Human Factors, 1988 年 12 
R). 在 黑暗 中 仰 躺 着 90 名 大 学 生 , 将 他 们 固定 在 
缓慢 旋转 圆 盘 下 的 旋转 平台 上 , 这 个 圆 盘 挡住 了 
他 们 的 全 部 视野 , 从 而 他 们 失去 了 方向 . 圆 盘 的 一 
半 涂 的 颜色 较 另 一 半 明 亮 . 当 学 生 认 为 他 们 是 右边 
向 上 时 就 喊 “ 停 ”, 这 时 记录 下 圆 盘 的 亮度 . 结果 90 
名 学 生 中 , 有 58 名 选择 了 较 明 亮 的 颜色 . 
a， 利 用 所 给 信息 估计 把 较 亮色 作为 右边 向 上 提示 的 
受 试 者 比率 真 值 . 构造 比率 真 值 的 9%5% 置信 区 间 . 
b. 你 能 从 a 的 结果 中 得 出 大 多 数 受 试 者 选择 亮色 而 
不 是 暗色 作为 右边 向 上 提示 的 结论 吗 ? 为 什么 . 





7.8 两 个 总 体 比率 差 的 估计 


XX — TORET. 7 节 的 方法 推广 到 两 个 二 项 比率 差 的 估计 . 例如 , 我 们 可 能 关心 机 器 1 生产 的 次 品 
XX py 与 机 器 2 生产 的 次 品 率 ps 的 比较 . 

设 y fl y, 分 别 表示 两 个 独立 的 二 项 试验 中 成 功 次 数 , 样本 容量 分 别 为 n, 和 nw. 为 了 估计 差 
(pi -p2), ZE p, I p, 是 二 项 分 布 的 参数 ( 即 两 次 独立 二 项 试验 中 成 功 的 概率 ) , 考虑 每 个 样本 中 
成 功 比 率 : I 

Pi EN 及 Pa Es 
HWE, RAAG -六 ) 作 为 (Pi — p) 的 合理 估计 . 因为 (2 -如 ) 是 二 项 随机 变量 yi M ya 的 线性 
函数 ， 其 中 E(y,) = nD; H V(y;) = hipidi, 所 以 有 
Es ba) EG) - EG) = E( 7.) - (73) 


1 n, 


1 1 1 1 
-—E 一 一 二 一 一 一 -一 = _ 
" (y1) a; P O2) "i (mpi) n, 2p2) Pi -Pp2 


V(bi -b3) = VCP) + VP) -2Cov( , 94) = " 2) + ál =) -0 (JU y 5 y, 相互 独立 ) 
ni nj 


Pigi Pod 
ni no 
因此 ，(Pi -Pa) 是 (pi — p) BOCA, 而 且 , 具有 最 小 方差 (证 明 略 ). 
对 充分 大 的 样本 容量 n 和 nx, 中 心 极限 定理 保证 (加 — p, ) 的 抽样 分 布 是 近似 正 态 的 . 由 此 ( 定 
FR7.2) , (py -p2) 的 大 样本 置信 区 间 可 以 如 下 面 的 框 格 所 示 得 到 . 
注意 , 必须 分 别 用 P, 和 RE pi 和 P 得 到 ti p) 的 估计 . 正如 单 样本 情形 , 当 m 和 足够 
A, 即 如 果 下 面 的 区 间 


1 1 1 1 
ao) tu 0o cu mpi) + 2 Cen) = 
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不 包含 0 或 者 样本 容量 (ni 9X n2) BJ, 这 种 近似 是 精确 、 合 理 的 . SIDE np, napa, n di 和 no q; 均 大 
于 等 于 4, 这 个 条 件 就 能 满足 . 





(p, -Pp;) 的 大 样本 (1 - a) 100% 置信 区 间 


p ji P d 
NEA 


(p, - P3) Ezan G -hy) = (p, =P) Ezan n, n; 


Kop p, o b, 是 样本 中 具有 感 兴趣 特征 的 观测 比率 . 
注 : ERENT, MERE D, G, Pa 和 ITE EE PM 
BE: 样本 容量 足够 大 时 这 种 近似 才 有 效 . 与 一 般 的 经 验 规则 一 样 ， ES nb >4, n 4 24, m mA fon d 24. 























函 丑 隔 一 位 交通 工程 师 研究 了 在 一 条 车 速 限制 公告 多 次 变化 的 道路 上 机 动车 的 行驶 速度 ， 当 公 
告 的 限制 速度 是 30 mile/h 时 , 工程 师 随 机 检测 了 100 辆 行驶 在 这 条 道路 上 的 车 速 , 发 现 有 49 辆 违反 
了 车速 限制 . 当 限制 速度 上 升 到 35 mile/h 时 , 又 随机 检测 了 100 WE, 发现 只 有 19 辆 违反 了 和 车速 限 
制 . >K (pi -ps) 的 99% 置信 区 间 , 其 中 pl 是 (在 相似 的 驾驶 条 件 下 ) 超 过 较 低 速度 限制 (30 mile/h) 的 
机 动车 的 比率 , p, 是 (在 相似 的 驾驶 条 件 下 ) 超 过 较 高 速度 限制 (35 mile/h) 的 机 动车 的 比率 . 

解 ” 在 这 个 例子 中 ， 





bim dag = 0.49 A Pa = 19 =0. 19 
注意 到 ， 
mjp,-49 — n4, -51 
np = 19 m 42 =81 
都 超过 了 4. 因此 , 我 们 能 够 利用 (Pi — p) 的 大 样本 置信 区 间 的 近似 . 
对 (1-a) =0.99 置信 区 间 , 这 里 w =0.01, zs =zo 00s =2.58( 由 表 B. 5). 将 它们 代入 置信 区 间 


a Pidi pg _ (0.49)(0.51) | (0.19) (0. 81) 
(Di id ss, [P Pe "uw C04 0. 19) +2. 58 100 " 100 


=0. 30 +0. 164 
我 们 的 解释 是 以 99% BJ Eb, 2509 Cfi (p, - p) 落 在 0.136 ~ 0.464 之 间 . Hi Ff HR A 
(0. 136) 是 正 数 , 我 们 完全 相信 违反 较 低速 度 限制 (30 mile/h ) 的 机 动车 比率 超过 了 违反 较 高 速度 限 
制 (35 mile/h) 的 机 动车 比率 . 超出 量 至 少 是 0. 136. 
由 于 实际 中 用 到 的 样本 都 足够 大 ，(P -Pa ) 的 小 样本 估计 方法 这 里 就 不 讨论 了 . 








应 用 练习 型 (公用 或 私 用 ) 和 MTBE 的 检测 水 平 ( 低 于 限制 或 检 
7.60 ”地 下 水 污染 . 参考 练习 2. 10, Environmental Sci- 出 ) 分 类 对 120 口 公用 井 和 103 口 私 用 井 , 下 面 的 
ence & Technology (2005 年 1 月 ) 关 于 新 罕 布什 尔 州 MINITAB 输出 给 出 了 检 出 MTBE 的 样本 中 并 的 个 数 . 


水 井中 甲 基 叔 乙 基 醚 (MTBE) 污 染 的 研究 . 223 口 井 a 估计 公用 井中 检 出 MTBE 的 比率 . 
的 数据 保存 在 MTBE 文件 中 . 每 口 间 都 按照 井 的 类 bp， 估计 私 用 井中 检 出 MTBE 的 比率 . 


用 置信 区 间 估 计 
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7.61 


c. 用 95 色 置信 区 间 比 较 a 和 b 的 比率 . 
d. 给 出 c 中 置信 区 间 的 实际 解释 . 哪 一 类 井中 可 检 
测 到 MTBE 的 比率 较 高 ? 

Tabulated statistics: MTBE-Detect, WellClass 





Rous: MTBE-Detect Columns: VellClass 


Private Public All 


Below Limit 81 ?2 153 
Detect 22 48 70 
All 103 12D 223 





Cell Contents: Count 


道路 投标 中 赢 者 的 儿 语 . 在 州 道路 建设 合同 的 

密封 投标 中 ,“ 赢 者 的 吕 语 是 用 来 描述 超过 合同 

期 望 价格 (交通 部 门 工 程 师 的 估价 ) 的 赢 者 (或 最 

高 ) 标 价 . The Review of Economics and Statistics( 2001 

^F 8 月) 做 了 竞拍 经 验 是 否 影响 出 现 “ 启 者 的 咒语 ” 

可 能 性 的 研究 . 对 两 组 暗箱 投标 人 做 了 比较: 

(1) 较 高 经 验 投标 人 ; (2) 较 低 经 验 投标 人 . 在 较 高 

经 验 组 ,189 个 竞标 成 功 的 人 中 有 29 人 高 于 项 目 

的 期 望 价格 ; 在 较 低 的 一 组 ,149 个 竞标 成 功 的 人 

中 有 32 人 高 于 项 目的 期 望 价格 . 

a 估计 较 高 经 验 投 标 组 中 成 为 赢 者 的 咒语 牺牲 品 
的 比率 pi. 

b， 估 计较 低 经 验 投 标 组 中 成 为 “ 赢 者 的 忠 语 > 牺牲 
ñH BJ 比率 P2- 

c. 求 p -p, BJ 90% BA X JH]. 

d. 给 出 c 中 置信 区 间 的 实际 意义 . 并 阐述 投标 经 验 

是 否 影响 “ 赢 者 的 听 语 ”出 现 的 可 能 性 , 








7.62 奥运 会 运动 员 兴 奋 剂 检 测 的 效果 . 促 红细胞 生 


RR (EPO) 是 一 种 违禁 药物 , 运动 员 用 它 来 增加 血 
液 中 的 含 氧 量 . 在 2000 年 澳大利亚 悉尼 奥运 会 上 
首先 执行 了 新 的 EPO 检测 . Chance (2004 年 春 ) 报 
告 了 830 名 世界 级 运动 员 样本 中 , 有 159 人 不 能 参 
加 1999 年 (新 的 EPO 检测 的 前 一 年 ) 的 世锦 赛 . 类 
似 地 , 825 名 有 潜力 的 运动 员 中 有 133 名 不 能 参加 
2000 年 的 奥运 会 . 是 不 是 新 的 检测 影响 了 运动 员 
参加 2000 年 的 奥运 会 ? 如 果 是 这 样 ,那么 不 能 参 
加 2000 奥运 会 的 运动 员 的 比率 将 大 于 不 能 参加 
1999 世锦 赛 的 运动 员 的 比率 . 利用 90% 置信 区 间 
比较 两 个 比率 , 并 给 出 恰当 的 结论 . 


7.63 细胞 生长 试验 ， 杜 克 大 学 医药 中 心 的 遗传 学 


家 把 E2F1 转录 因子 作为 控制 细胞 分 裂 的 重要 组 成 
部 分 (Nature, 1993 年 9 月 23 A). 研究 者 对 两 批 血 
清 -抑制 细胞 实施 了 DNA 合成 技术 . 对 一 批 细胞 


N 


N 


中 的 每 一 个 注射 微量 的 E2F1 转录 因子 , 但 是 没有 
对 第 二 批 (控制 组 ) 注 射 E2F1.30h 后 , 记录 了 每 一 
批 中 发 生变 异 的 细胞 数量 , 试验 结果 见 下 表 . 








fs 制 E2F1 处 理 细胞 
总 细胞 数 158 92 
A25 p ere 15 4l 


资料 来 源 : Johnson, D. G., 
tion factor E2F1 induces quiescent to enter Sphase. " Nature, 


Vol. 365, No. 6444, Sept. 23, 1993, p. 351( Table 1). 


a. 用 90% 置 信 区 间 比 较 两 批 细胞 中 发 生变 异 的 细 
胞 的 百分比 . 

b. 用 a 中 的 区 间 解 释 E2F1 转录 因子 诱导 细胞 生长 
的 作用 . 


et al. “ Expression of transcrip- 


.64 灭绝 的 新 西 兰 岛 类 . 参考 练习 7.35， Evolution- 


ary Ecology Research( 2003 年 7 月 ) 对 新 西 兰 鸟 类 总 

体 中 灭绝 模型 的 研究 . NZBIRDS 文件 中 保存 了 新 西 

兰 在 毛利 人 殖民 时 期 132 种 鸟 的 飞行 能 力 和 灭绝 

状态 的 数据 . 生态 学 家 想 对 两 个 新 西 兰 鸟 类 总 体 

(已 灭绝 和 没有 灭绝 ,比较 不 能 飞 的 鸟 ) 的 比率 . 由 

NZBIRDS 文件 得 到 的 样本 信息 见 下 表 . 

a. 构造 已 灭绝 和 没有 灭绝 的 鸟 类 中 不 能 飞行 的 鸟 
的 比率 差 的 95% 置信 区 间 . 

b， 生 态 学 家 正在 研究 关于 灭绝 鸟 类 中 不 能 飞 的 鸟 的 
比率 大 于 没有 灭绝 鸟 类 中 不 能 飞 的 鸟 的 比例 的 理 
论 . a 的 置信 区 间 能 支持 这 个 理论 吗 ? 为 什么 . 


鸟 类 总 体 抽样 的 鸟 类 数 — 不 能 飞 的 鸟 类 数 
已 灭绝 38 21 
没有 灭绝 78 7 





.65 AERAR. Journal of Fish Biology 


(1990 4E 8 A ) RE TEATRA rh 62 rh R 
的 寄生 虫 ( 缘 虫 ) 流 行 病 比较 研究 . 在 地 中 海 捕捞 了 
588 条 鱼 并 进行 了 解剖 , 发 现 有 211 条 鱼 感染 寄生 
Hp 在 大 西洋 捕捞 了 123 条 鱼 并 解剖 ,发现 有 26 条 
感染 寄生 虫 . 用 90% 置 信 区 间 比 较 两 个 海域 捕捞 到 
的 鱼 类 感染 寄生 虫 的 比率 . 并 解释 这 个 区 间 . 


.66 ”预测 软件 的 缺陷 . 参考 PROMISE 软件 工程 知 


识 库 中 为 NASA 宇宙 飞船 用 C 语言 编写 的 498 个 
软件 代码 模块 ,保存 在 SWDEEECTS 文件 中 .，( 参 
考 第 3 章 的 活动 中 的 统计 学 . ) 回忆 对 每 个 模块 中 
的 软件 代码 评价 是 否 存在 缺陷 ; 49 个 标 以 * 真 ”( 即 
模块 有 缺陷 的 代码 ), 449 个 标 为 “ 假 ”( 即 模块 是 
正确 的 代码 ). 将 这 些 当 作 软 件 代码 模块 的 独立 随 
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机 样本 , 研究 者 利用 简单 的 算法 “ 如果 模 块 中 代码 .准确 率 . RII 9990 置信 区 间 ， 





行 数 超过 50, 预测 模块 有 缺陷 ?来 预测 每 个 模块 的 DEFECT * PRED LOC Crosstabulation 
缺陷 状态 . SPSS 打印 输出 显示 了 两 个 样本 中 的 预 Count 

测 有 缺陷 (PRED_LOC = “yes” ) 和 预测 没有 缺陷 I 

(PRED_LOC = “no” ) 的 模块 个 数 . 现在 , 定义 算法 DEFECT false 

的 准确 率 为 正确 预测 的 模块 比率 ,比较 应 用 于 有 true 


Total 





缺陷 的 代码 模块 与 应 用 于 正确 代码 模块 时 算法 的 
7.9 总 体 方差 的 估计 


前 面 几 节 研究 了 总 体 均值 和 比率 的 区 间 估 计 . 这 一 节 , 我 们 讨论 总 体 方差 o? 的 置信 区 间 , 在 
7.10 节 将 讨论 两 个 方差 比 (ci/ o3) 的 置信 区 和 间 . 与 均值 和 比率 不 同 , 方差 的 枢 轴 统计 量 不 具有 正 态 
分 布 或 了 分 布 . 而 且 , 无 论 样本 容量 如 何 , 都 需要 一 定 的 假定 条 件 . 

ËL yr, yo, U, ys 是 来 自 均 值 为 方差 为 o? 的 正 态 分 布 随机 样本 . 由 定理 6.11 A, 

x 一 (n — I )s 
G” 
具有 自由 度 为 (n -1) 的 卡 方 分 布 . o? 的 置信 区 间 是 基于 枢 轴 统计 量 y? 

x^ 分 布 的 上 尾 面 积 已 经 制 成 表 , 见 表 B. 8. 与 Z 和 了 分 布 不 一 样 , x? 分 布 关于 0 不 对 称 . 为 了 求 
出 分 布下 尾 处 面积 为 a BJ 值 , 我 们 必须 求 出 Xf _。, FP pO? > X1.,) 21-a. 例如 ， 当 自由 度 为 
9 时 , 在 分 布下 尾 面积 为 a=0.05 的 x? EEx a 2X5 05 23. 32511 (UL 3& B.8). 利用 这 个 事实 写 出 枢 
轴 统 计量 x? 的 概率 表达 式 : 








PO -a2 © Y! € X32) =1-a 
其 中 好 22 和 好 -是 好 分布 的 两 个 尾部 概率 为 a/2 ABB x? 制 r0 
表 值 ( 见 图 7.12). 在 上 面 的 概率 表达 式 中 用 [ (n - 5? ]ve2 代 
替 刀 ,并 进行 简单 的 代数 计算 ,得 到 


(n- 1) 2 
2 


p| -aas < xan) 








ü (4 < 1 < Xen | 
(n-1)s o? (n-1)s 

_ 2 _ 2 
-p| Es < o2< s -l-a 图 7. 12 卡 方 分 布 的 好 -wz 和 Xe 位 置 

Xar2 X1 -a72 
因此 , o? 的 (1 - a) 10096 置信 区 间 是 
(n-1)s? < < (n-1)s? 


2 = G = 2 
Xa/2 Xl -a72 


/ 








总 体 方差 o 的 {1 -— a) 00% 置信 区 间 
(n-Ds < < (n- Ds 
Xa X -0/2 
Kr ys fYi uum BLUE BEA O1) ty)! 分 布 的 右 尾 和 左 尾 概 率 为 a/2 M Y, 值 . 
假定 : 抽样 总 体 有 近似 正 态 分 布 . 
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注意 , 这 种 估计 方法 对 大 的 或 小 的 n 都 适用 , 在 每 种 情况 下 ,都 要 求 抽样 总 体 的 正 态 性 假定 . 
负 头 厂 的 质 检 员 知道 每 一 盒 锥 头 的 精确 重量 是 不 同 的 , 因为 有 一 些 不 可 控 因 素 影响 重 
hi. 每 盒 缸 头 的 平均 装 和 人 量 是 一 个 重要 的 指标 , 但 是 装 人 量 的 方差 o 同样 重要 . 如 果 o? 较 大 , 那么 
有 些 色 头 的 装 入 量 太 少 而 另 一 些 又 太 多 . 为 了 估计 铅 头 装 信 量 的 方差 , 质 检 员 随机 抽取 10 e B: sgk 
出 它们 的 重量 , SERE CIE RI) PUTES 7.8 中 . 构造 铅 头 厂 生 产 的 镀 头 装 入 量 方差 的 90% 置信 区 间 . 
表 7.8 WESCE ABUEBR 
7.96 7.90 7.98 8.01 7.97 7.96 8.03 8.02 8.04 8.02 








解 ” 质 检 员 希望 估计 装 人 量 的 总 体 方差 o?, o? 的 (1 - a) 100% 置信 区 间 是 : 


te- De agna Ce Tg 
Xan Xi- a/2 


为 了 使 得 这 个 置信 区 间 有 效 ,必须 假定 观测 值 ( 装 入 量 ) 的 样本 来 自 正 态 总 体 . 

为 了 计算 置信 区 间 , 需要 计算 样本 方差 2 或 者 样本 标准 差 ;. 样 木 数据 的 描述 性 统计 量 见 图 
7.13 的 EXCEL 输出 . 图 7. 13 的 阴影 部 分 的 * 值 是 * =0. 043. 

现在 , (1-a) =0.90, o/2 =0.10/2 =0.05. 因此 查 自由 度 为 (n -1) =9 ËJ x6 os fll yà os (CŒ B. 8) f] 

X0o5 =16.9190 和 xos =3.325 11 
将 这 些 值 代 人 公式 , 我 们 有 
(10 - 1) (0. 043)? _ «C10 - 1) (0. 043)? 
16. 9190 <o? 3.325 11 
0. 000 98 <o? <0. 005 00 

CR: 这 个 区 间 在 图 7. 13 d ) 













7.989 
0.013618 
7.995 




















E — m 
.4 |Sample Size ng s L-- 10 
15 [Sample Standard Deviation - |= 0.043 
* Confidence Level s s= | $x 
diate Calculations ied 
"^ " T: zd 











[o 000984 
1s 0.005005 








E: = 











| Assumption 
ral 


23 IP lation from which sample was drawn has an n approximate normal distribution. — 


图 7. 13 装 入 物 重量 数据 的 EXCEL 描述 | 性 统计 量 和 置信 区 区 间 


A 7^7 .x- 
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我 们 有 90% BREF] MOESIA REB 77 25 BB ETE 0. 000 98 ~ 0.005 00 之 间 . 质 检 员 可 以 
Fax A DX TRIER: RU E os A EB yas KA, 是 否 违反 了 管理 部 门 的 技术 规格 要 求 . 
EHI 参考 例 7.14. 求 铅 头 重量 标准 差 真 值 o 0 90% E fl. 
解 o 的 置信 区 间 可 通过 求 o? 置信 区 间 上 下 限 的 平方 根 得 到 . 因此 , o 的 90% 置信 区 间 是 ， 
V0. 000 98 <o < vO.005 00 


0.31<o<0.071 307 
我 们 有 90% 的 置信 色 头 重量 的 标准 差 真 值 在 0. 031 ~ 0. 071 zit] zz B]. 


(Q) 应 用 练习 7.71 有 毒 成 分 的 提取 . 一 项 叫做 基质 固 相 分 散 
£ > 经 fü [s] ` A 
7.67 未 让 方 舍 . 对 下 面 每 组 中 的 a MAMED, Ep MERAT ENIK Aa KO RE E DACE IE 
给 出 卡 方 分 布 上 尾 面 积 为 o WESH: 提取 质量 有 机 物 ( 有 毒 成 分 ) (c romatographia , 1995 
a a-005,di27 — b a-0.10. di^ 16 年 3 月 ). 将 一 种 有 毒物 质 注 射 在 未 污染 的 鱼 片上 ， 
c a-0.01. df=10 d a-002 di-8 然后 用 MSPD 方法 提取 毒素 . 为 估计 这 种 方法 的 精 
c a=0.005, du 确 性 , 在 一 块 鱼 片上 得 到 7 个 测量 值 . 毒素 复原 百 
a anl . 分 数 的 汇总 统计 量 为 :了 =99% , s 2995. 用 95% R 
7.68 监测 腿 部 运 a . 参考 练 : 7.30, IEICE 
p AME A AT BA) 信 区 间 估计 用 MSPD 方法 复原 百分数 的 方差 
ransactions on Information & Systems ( 2005 4E 1 H) 7.72 沉淀 物 中 的 PCB 进行 项 实验 室 研究 以 确定 
关于 监测 腿 部 运动 阻抗 的 试验 . 工程 师 将 电极 系 在 — ”72 TRA ETT. BUSES PALEIS 
n xo MANNA ebat etr VI b E 30953 ( PCBs) 测量 水 平 的 方 
志愿 者 的 脚 踩 和 膝盖 上 , 测量 阻抗 变化 的 信 品 比 i 
" 38 ( Analytical Chemistry, 1985 年 11 H ). 收集 来 自 
(SNR). 前 面 介绍 过 对 某 个 脚 躁 - 膝盖 电极 对 , 10 aa MM 
n - 马萨诸塞 州 新 贝 德 福 德 港 的 已 被 PCB 污染 的 沉淀 
名 志愿 者 样本 的 SNR 的 均值 是 19.5, 标准 差 是 e QUUM 
4.7. R SNR 阻抗 变化 的 标准 差 真 值 的 95% gr 物 样本 , 并 制备 为 等 分 的 溶液 .作为 研究 的 一 部 
间 并 解释 分 , 由 单个 实验 室 利 用 Webb- MeCall 方法 确定 5 个 
69 水 动力 系统 的 跳动 . 跳动 用 来 描述 水 动力 系统 。 等 分 随机 样本 中 每 一 个 的 PCB 浓度 , 分 析 人 员 得 
unn m 、 _ . 、 到 平均 PCB 浓度 是 56 mg/kg, 标准 差 是 45 mg/kg. 
在 引流 时 间 上 的 变异 ， 低 流量 跳动 对 水 道 技术 的 求 用 Webb- McCall Jy cie Boc oh PCB Yk IE: 
成 功 很 关键 . 一 项 原型 系统 等 离子 体 断 路 开关 的 流 UM PIRE T 
量 跳 动 研究 . . 方差 的 置信 区 间 . 
51 ( Journal of Applied physics, 1993 年 9 - 
- 4H NU 二 0 778 岩石 中 的 流质 包 体 . 地 质 学 家 分 析 岩 石 中 的 流 
HX n 218 次 试验 得 到 了 下 面 的 描述 性 统计 量 : y OEE E Eks mi lt ERE 
=334.8 ns, s=6.3 ns. (i: 引流 时 间 定 义 为 下 游 m 岩石 结晶 时 出 现 的 流质 组 成 为 此 开 


N 


水 量 等 于 上 游 水 量 10% 时 所 用 的 时 间 ，) PB GRO RUE 
a. 构造 原型 系统 引流 时 间 标准 差 的 95% 置 信 区 间 | 1 MK SS n Y : pplie 


b， 如 果 一 个 原型 系统 的 引流 时 间 标 准 差 真 值 小 于 Mil nad n nh nn BORA 
7 ns, 就 称 这 个 系统 是 低 流量 跳动 的 .上面 的 原 F 巴西 石英 谱 学 


型 系统 满足 这 个 要 求 吗 ?为 什么 ? 研究 . 测量 同一 个 流质 包 体 4 天 的 液态 二 氧化 碳 
70 冰 融 化 池 的 反照 率 , 参考 练习 7 34 国家 冰雪。 (CODAE 数据 (摩尔 分 数 ) 如 下 : 
数据 中 心 (NSIDC) 收 集 的 冰 融 化 池 的 反照 率 数据 . 86.6 84.6 85.5 85.9 
504 个 加 拿 大 北极 冰 融 化 池 样 本 得 到 的 反照 率 数据 
保存 在 PONDICE 文件 中 . 求 所 有 加 拿 大 北极 冰 融 a 构造 CO, 浓度 测量 值 方差 的 99% 置信 区 间 , 得 
化 池 得 到 的 反照 率 数据 方差 的 90% 置信 区 间 . 并 给 到 LRM 技术 精确 性 的 估计 . 
出 区 间 的 实际 和 理论 解释 . b. 为 使 区 间 估 计 有 效 所 要 求 的 假定 是 什么 ? 


7.10 两 个 总 体 方差 比 的 估计 
比较 两 个 总 体 方差 of 和 o5 的 常用 统计 方法 是 推断 比 01/0. 这 是 因为 当 样本 是 随机 、 独 立地 来 自 两 


N 
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个 正 态 总 体 时 , ot/o3 估计 量 的 抽样 分 布 是 已 知 的 . 在 这 些 假定 下 , o1/02 的 置信 区 间 基 于 枢 轴 统计 量 : 
Xi n 

其 中 好 和 好 分 别 是 自由 度 为 vi = (mm -1) 和 vw = (n -1) 的 独立 卡 方 随机 变量 . 用 (n - 1952/70? 代 

赫 妇 2( 见 定理 6. 11). 我 们 得 到 





(nj -1)s] 





/(n, -1) 
Fa n di ! - -人 中 全 
和 [tp (n; -1)s 52/92 s3 o? 





HUE X6. 17 知 , 天 具有 分 子 自由 度 为 v1 = (n, -1)、 分 母 自由 度 为 z = (ns - 1) BJ F 490. 下 分 布 关于 
它 的 均值 可 能 是 对 称 、 左 偏 或 右 偏 ; CREAR s? 和 s3 的 自由 度 , BC, -1) 和 (ns -1) 有 关 . 

为 了 求 ct/o3 的 置信 上 下 限 , 我 们 需要 求 相应 于 分 布 尾部 面积 的 正 制 表 值 , 对 a =0. 10, 0.05, 
0. 025 和 0.01 KJ L F (Er, 分 别 见 表 B. 9 ~ B. 12, 表 B. 10 的 部 分 结果 见 表 7. 9. RAISATA 
统计 量 分 子 的 样本 方差 sf 的 各 个 自由 度 , 行 相应 于 分 母 的 样本 方差 3 的 自由 度 . 例如 ， 当 分 子 自由 
度 =7, 分 母 自由 度 mm =9 时 , 就 有 Fo os =3.29( 表 7.9 的 阴影 部 分 ). 因此 , a =0.05 是 分 子 自由 
度 为 7、 分 母 自由 度 为 9 的 正 分布 3. 29 右边 的 尾部 面积 . 即 P(E > Foos) =0.05. 

表 7.9 X B.10 的 省 略 形 式 : F 分 布 的 制 表 值 , < =0. 05 














vi 分 子 自 由 度 
Vj 1 2 3 4 5 6 7 8 9 
1 161.4 199.5 215.7 224. 6 230.2 234.0 236.8 238.9 240. 5 
2 18. 51 19. 00 19.16 19.25 19. 30 19. 33 Wy 19.37 19. 38 
3 10. 13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 
4 7.71 6.94 6. 59 6. 39 6. 26 6. 16 6.09 6. 04 6. 00 
5 6. 61 5. 79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 
6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 
28 Bi 8 5.32 4. 46 4.07 3.84 3. 69 3.58 3.50 3. 44 3. 39 
me 5.12 4.26 3. 86 3. 63 3.48 3.37 3. 29 3.23 3.18 
10 4.96 4.10 3.71 3. 48 3. 33 3.22 3.14 3.07 3.02 
11 4. 84 3.98 3. 59 3.36 3.20 3.09 — 2.95 2. 90 
12 4.75 3.89 3.49 3.26 3.11 3. 00 2.91 2.85 2. 80 
13 4.67 3.81 3.41 3.18 3.03 2.92 2. 83 2.77 2.71 
14 


4. 60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2. 65 

-一 一- 72270 X 265 

K B.9 ~B. 12 RAR FARTA. 但 是 可 以 证 明 (证 明 略 ) ; 

1 
Fa(v;, vi) 
其 中 F _。(v1，, n) EJ F2F BER n, AREE H EE 9 v, BJ F aR TEARD a hi F, 
Fa(v2 ,v1 ) ÆW F Ff. B HEREDI n, 分母 自由 度 为 v H F Ari BU k IEE a BJ F f8. 例如 , 假设 
要 查找 Vi =7, v, =9 BJ F bti FEE a = 0. 05 的 值 ， 即 希 望 求 Fi aln V5) = Fo 957, 9). 首先 ， 
从 表 7. 9 中 查找 上 尾 值 Fo 0s (9, 7) =3. 68( 注 意 , 必须 交换 F 的 分 子 和 分 母 自 由 度 才 能 得 到 这 个 


Fi sn, v2) = 


E 
- 
+k 
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值 ), 然后 计算 
1 1 
Fo 0s(9, 7) 3.68 
利用 前 面 的 符号 , 可 以 写 出 枢 轴 统 计量 下 的 概率 表达 式 ( 见 图 7. 14) : 
P(Fi (Vi, v) SFSF a(r, n))=l-a KF) 


$ Fr=Fi an, Fy=F n, JFRRIG2/822) (02/70) 46$ F, 





Faos(7, 9) = =0.272 





就 得 到 : 
2 2 
si1\/02 
PULS FF =P|F. < ( $) (B) <r] | | 
$5 1 ^ 2 
2 2 F 
$2 05 _ 32 0 F,., Fyr 
pr ein) l-a 2 
$1 9j 31 
2 2 2 图 7. 14 », = (n, -1)#l 
P| = LS z) l-a (n, - 1) f F 4i 
= . =< =< . = 一 p, = ( n, 一 A 
si Fy o s Fi 2 2 
或 





2 2 

sI 1 91 5] I 

P| . <—=<— ， -l-a 
s Fann, v2 ) o s2 F, van, v) 


H V Fus, v) REF, usn, n), 得 到 置信 区 间 的 最 后 表示 : 





2 2 2 

si 1 Ti 5j 

PUT =< 39 Fm.) -1-a« 
$5 a2, vj) 05 S$ 





两 个 总 体 方差 比 01/02 的 (1 — a) 10092 置信 区 间 


2 2 2 
$1 1 Ti 85 





Fn, v) 


2X 


i Fn, >) wl s 
其 中 FAO 5n) 2-3 EB n = (n -1)、 TEHE v, = (n, - 1) B8 F ks E E W # 3, a2 BF 
f&, Fal, v) 2-3 BE v = (n, — 1), 28 B 由 度 -(n-DBWF2t EE W 3 28 FE. 
假定 : 1， 两 个 抽样 总 体 具有 近似 正 态 的 相对 频率 分 布 . 
2. 随机 样本 是 从 两 个 总 体 中 独立 地 选取 的 . 




















与 单个 样本 情形 相同 , 无 论 两 个 样本 容量 如 何 , 必须 有 正 态 总 体 的 假定 . 
工厂 以 组 装 线 的 两 种 不 同 物理 排列 对 生产 线 进行 试验 . 已 经 确定 两 种 排列 每 天 已 完成 单 
位 的 平均 数 近似 相同 . 为 了 得 到 使 生产 处 于 最 好 过 程控 制 的 排列 , 提议 采用 每 天 生产 的 已 完成 单位 
个 数 较 小 方差 的 排列 . 表 7. 10 给 出 了 两 种 独立 随机 样本 的 观察 结果 . 构造 两 种 组 装 线 排 列 的 日 加 工 
零件 个 数 方差 比 of/o3 的 95% 置信 区 间 . 依据 此 结果 ,你 推荐 娜 一 种 排列 ? 


表 7. 10 ”两 种 组 装 线 的 日 加 工 零件 数 
生产 线 1 448 523 506 500 533 447 524 469 470 494 536 


481 492 567 492 457 497 483 533 408 453 
生产 线 2 372 446 537 592 536 487 592 605 550 489 461 
500 430 543 459 429 494 538 540 481 484 374 
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解 ”两 条 组 装 线 的 概括 统计 量 见 图 7. 15 的 SAS 输出 (着 重 显示 ). 注意 sl = 1407.89, s2 23729. 41. 
为 了 构造 置信 区 间 , 必须 假定 两 条 组 装 线 


Sample Statistics 


的 日 加 工 等 件数 是 近似 正 态 分 布 ' 因为 希望 求 | wx ean Sd. Dev. Variance 
95% 置 信 区 间 , 所 以 a/2 值 是 0. 025， 需 要 查找 | 和 


Fo. gos (V1，V2) 和 Fo gos (v5. vi). 样本 大 小 是 
n; -21 fln, = 25; 所 以 查分 子 自由 度 为 v1 = 
(n, -1) =20 和 分 母 自由 度 为 v= (n; — 1) = 
24 的 Fo qos (v1 , v5) 的 值 . 由 附录 表 B 表 11, 查 
得 Fo 955 (20, 24) 22.33. 对 应 地 , 分 子 自 由 度 
为 y= (n, — 1) = 24 HZ SEE B EE v, = 


Hypothesis Test 


Variance 1 / Variance 2 = 1 
Variance 1 / Variance 2 ^- 1 


Null hypothesis: 
filternative: 


- Degrees of Freedom - 


F Numer . Denon. Pr > F 


35X Confidence Interval of the Ratio of Two Var iances 


Lower Limit Upper Limit 


(n, -1) =20 的 Fo os (v5, vi ) 的 值 . 由 表 B. 11 
查 得 , Fo os (24, 20) =2. 41. 

Hsi, 5j, Fo. oos (i , v2) 和 Fo. gos (v5, vi) 
的 值 代 和 置信 区 间 公 式 , 得 到 


图 7.15 组 装 线 数据 的 SAS 描述 性 统计 量 和 置信 区 间 


1407. 89 





(1407.89)/ 1 \_o 
(z3))* 


(3729.41) 


ol ~ 3729. 41 


(2.41) 


gi 
0. 162 « — «0. 909 
9 


(È: 这 个 区 间 显 示 在 图 7. 15 的 底部 . ) 


我 们 有 95% 的 置信 估计 总 体 方差 比 的 真 值 r?/eo3 落 在 0. 162 ~ 0. 909 之 间 . 因为 区 间 内 的 所 有 
值 均 小 于 1.0, 所 以 第 一 条 组 装 线 的 日 产 零 件数 的 方差 (由 o? 度量 ) 小 于 第 二 条 组 装 线 的 日 产 零 件 


数 的 方差 (由 o5 度量 ). 


应 用 练习 

7.74 K Fi SEAT H HEEE 15. 分母 自 由 度 是 
12 W F rfi, *4 o 取 下 列 值 时 , R F, : 

a. a=0.025 b. «20.05 c. «20.10 

7.75 RF. 对 下 列 情况 下 下 分 布 , R Foos KITE: 

a. 分子 自由 度 7, 分 母 自由 度 25. 
b. 分 子 自由 度 10, 分 母 自 由 度 8. 
c. 分 子 自由 度 30, 分 母 自由 度 60. 

d. 分 子 自由 度 15, 分 母 自 由 度 4. 

776 森林 入 口 通道 属性 . 参考 练习 7. 42, lnter- 
national Journal of Forest Engineering (1999 年 6. 
月 ) 关 于 爱尔兰 森林 入 口 通道 属性 研究 . 对 32 
个 矿石 路 基 和 40 个 泥 煤 路 基 的 独立 随机 样本 测 
量 瞬 变 表面 垂 度 (mm) ,结果 见 下 表 . 用 95% 的 
置信 区 间 比 较 两 类 路 基 的 表面 重度 的 方差 , y 
五 路 基 和 泥 煤 路 基 中 哪 一 种 具有 最 大 的 表面 重 
度 方差 . 











首 路 路 基 
矿 物 W 煤 
道路 数量 32 40 
平均 表面 垂 度 (mm) 1. 53 3. 80 
标准 差 3. 39 14.3 


资料 来 源 : Martin, A. M. ,et al. “Estimation of the serviceability 
of forest access roads. " International Journal of Forest Engineer- 
ing, Vol. 10, No. 2, July 1999( adapted from Table 3) 


7T. T7. 机 器 人 的 感应 运动 . 参考 练习 2. 54,，The Inter- 


national Journal of Robotics Research ( 2004 年 12 月 ) 
估计 机 器 人 手臂 感应 运动 的 算法 . 一 个 关键 的 变量 
是 估计 手 辟 转动 误差 (弧度 ). 对 于 固有 干扰 和 投 
影 干 扰 不 同 组 合 的 11 次 试验 , 转动 误差 数据 重新 
列 于 表 中 . 假定 转动 误差 的 方差 是 重要 的 , 研究 人 
员 希 望 比较 不 同 的 固有 和 投影 误差 的 方差 . 他 们 尤 
其 希望 估计 只 有 固有 干扰 没有 投影 干扰 误差 的 方 
差 与 只 有 投影 干扰 没有 固有 干扰 的 误差 的 方差 之 
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Ar 7 x 


m7 





N 


7.11 


解决 依赖 下 面 问题 的 回答 : 你 希望 置信 区 间 大 概 


误差 的 函数 . 例如 , z 的 小 样本 置信 区 间 的 半 宽 五 是 : 


E. 用 90% 置信 区 间 估计 这 个 参数 . (提示: 删 掉 第 
1 次 试验 的 数据 ) 





、 旋转 误差 
序 号 固有 干扰 ”投影 干扰 (弧度 ) 
1 No No 0. 000 003 4 
2 Yes No 0. 032 
3 Yes No 0. 030 
4 Yes No 0. 094 
5 Yes No 0. 046 
6 Yes No 0. 028 
7 No Yes 0. 27 
8 No Yes 0. 19 
9 No Yes 0.42 
10 No Yes 0.57 
11 No Yes 0. 32 


资料 来 源 : Strelow, D. , and Singh, S. “Motion estimation 


form image and inertial measurements. " 


23, No. I2, Dec. 


The International 
Journal of Robotics Research, Vol. 
2004. ( Table 4) . 


.78 污染 物 的 大 气 传播 . 在 Environmental Science & 


Technology( 1993 年 10 月 ) 中 , 科学 家 报告 了 关于 PC- 
DD( 一 种 从 固体 废物 焚烧 、 机 动车 、 钢 铁 厂 和 金属 加 
工厂 散发 的 污染 物 ) 的 传播 和 转化 的 研究 . 收集 了 某 
些 不 同日 子 里 瑞典 的 两 个 地 方 一 一 Rorvik (11 <) 和 
Gothenburg(3 天 ) 的 空气 样品 . 这 里 给 出 每 个 样品 的 
PCDD(pg/m ) 含 量 . 用 区 间 佑 计 比 较 两 个 地 方 PCDD 
含量 的 方差 , 并 由 分 析 给 出 一 个 推断 . 


Rórvik Gothenburg 








2.38 3.03 1.44 0.47 | 0.50 061 0.90 
0.50 0.22 0.26 0.31 
0.46 1.09 2.14 





资料 来 源 : Tysklind, M. , 


transformation 


et al. " Atmospheric transport and 
of polychlorinated — dibenzo-p-dioxins and 
dibenzofurans. ” Environmental Science & Technology, Vol. 


27, No. 10, Oct. 1993, p. 2193( Table II). 


选择 样本 容量 


7.79 环 氧 修补 接头 的 强度 . 参考 练习 7.41， Journal 


of Structural Engineering(1986 年 2 月 ) 关 于 环 氧 修补 
捆扎 接头 试验 . 为 方便 起 见 , 这 里 再 次 给 出 数据 . 构 
造 两 种 木头 制造 的 环 氧 修补 的 捆扎 连接 处 切断 应 力 
方差 比 的 90% 置 信 区 间 . 依据 这 个 区 间 , 是 否 有 证 
据 表明 两 个 切断 应 力 的 方差 不 同 ? 并 给 出 解释 . 





南方 松 西 黄 松 
样本 容量 100 47 
平均 切断 应 力 1312 1 352 
标准 差 422 271 


资料 来 源 : Avent, R. R. "Design criteria for epoxy repair of 
timber structures. " Journal of Structural Engineering, Vol. 


112, No. 2, Feb. 1986, p. 232. 


.80 沉淀 物 中 的 PCB. 参考 练习 7.52 关于 PCB 的 


研究 . 用 Webb- McCall 方法 测量 一 个 5 个 等 分 样本 

的 PCB 水 平 . 用 另 一 种 方法 (叫做 氯 化 二 葵 标 准 对 

照 方法 ) 测 量 了 另外 5 个 等 分 的 沉淀 物 样本 的 PCB 

KE. 两 个 样本 PCB 水 平 统计 量 见 下 表 . 

a. 构造 用 两 种 方法 测量 的 PCB 水 平 的 方差 比 的 
90 置信 区 间 . 

b. 为 使 区 间 估 计 有 效 , 需要 满足 什么 假定 ? 


Webb-MeCal — $t — Abiit 





样本 容量 5 5 
平均 PCB KF (mg/kg) 56 60 


标准 差 0.45 0. 89 
资料 来 源 : Alford-Stevens, A. L. , Budde, W. L. , and Bel- 
lar, T. A. "Interlaboratory study on determination of poly- 
chlorinated biphenyls in environmentally contaminated sedi- 
ments. " Analytical Chemistry, Vol. 57, No. 13, Nov. 1985, 
p. 2454. Reprinted with permission from Analytical Chemis- 
try. Copyright 1985 American Chemical Society. 


对 实际 问题 应 用 统计 时 , 遇 到 的 基本 问题 之 一 是 确定 包含 在 样本 中 的 观测 值 个 数 . 这 个 问题 的 


宽 ? 你 要 求 的 置信 系数 是 什么 ? 


你 可 能 已 经 注意 到 在 7.4 ~7. 10 节 介绍 的 许多 置信 区 间 的 半 宽 是 样本 容量 和 牵涉 的 点 估计 标准 


H= tan C) 
其 中 ioo Peak HE n, HE, 也 是 由 样本 数据 计算 出 来 的 统计 量 . 因为 在 选取 样本 之 前 我 们 不 
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知道 *， 无 法 控制 它 的 值 , 减少 置信 区 间 宽 度 最 简单 的 方法 是 增加 样本 容量 n. 一 般 地 , 样本 容量 越 
K, 你 获得 的 信息 就 越 多 , 置信 区 间 的 宽度 越 小 . 下 面 用 两 个 例子 来 说 明 选 择 样本 容量 的 方法 . 
ERES 作为 美国 能 源 部 (DOFE ) 调查 的 一 部 分 , 随机 选取 美国 家 庭 , 让 他 们 回答 去 年 花费 在 家 庭 
取暖 的 油 汽 支出 . DOE 特别 关心 去 年 取暖 燃料 费用 的 平均 值 . 如 果 DOE 想 用 0. 95 的 置信 系数 并 且 使 
u 的 估计 精度 在 10 美元 以 内 , 样本 中 应 包含 多 少 户 家 庭 ? 

解 DOE 想得到 一 个 置信 系数 等 于 (1 - a) =0.95、 区 间 的 半 宽 等 于 10 K) u 的 区 间 估 计 . u 的 大 
样本 置信 区 间 的 半 宽 是 : 


G 
Hz2,50; EN 


在 这 个 例子 中 , RITA H=10, 2,5 22505 = 1.96. 为 了 解 关于 的 方程 ， 8E EU. o. BE, FAE 
实际 问题 中 经 常 遇 到 的 那样 , o 是 未 知 的 . 但 是 , 如 果 假定 DOE 根据 以 前 的 记录 知道 年 燃料 支出 量 
的 近似 极 差 是 520 美元 . 那么 可 以 令 这 个 近似 极 差 等 于 4o9. 因此 ， 
4o 二 520 或 者 0-130 
求解 n, 我 们 有 
H=s.[ 7) 或 者 10=1.96[ =) 
或 者 
.(1.96)?(130)? — 
"7 00? ~ 
所 以 , DOE 需要 由 650 户 美国 家 庭 给 出 的 响应 才能 以 95% 的 置信 、 以 不 超过 10 美元 的 误差 估计 去 
年 美国 家 庭 的 平均 燃料 费 支出 . 因为 这 个 调查 需要 花费 -一定 的 费用 . DOE 可 能 决定 允许 最 大 的 半 宽 
(A H - 15 或 石 =20) 减 少 样本 容量 或 者 可 能 减 小 要 求 的 置信 系数 . 重要 的 一 点 是 为 了 利用 试验 之 前 
确定 的 近似 样本 大 小 , 使 最 后 的 估计 值 达 到 指定 的 程度 , 试验 者 可 以 进行 抽样 尝试 
DAJ 一 个 产品 质量 监督 员 怀 疑 两 台 不 同 机 器 生产 的 产品 不 合格 品 率 p, Mp 存在 不 同 试验 表 
明 两 台 机 器 生产 的 产品 不 合格 品 率 都 在 0.03 左右 . 如 果 质 检 员 想 以 0. 95 的 概率 要 求 两 个 不 合格 品 率 之 
差 的 估计 精确 到 0.005 以 内 , 他 必须 从 每 台 机 器 生产 的 产品 中 随机 抽样 多 少 件 ? (假定 n, = n> =n. ) 
E ”因为 我 们 想 以 9596 fei bx Bei (p, - p.) , 利用 z4/ 7490255 71.96. 又 因为 这 个 估计 精确 
到 0. 005 以 内 , 即 置信 区 间 的 半 宽 必须 等 于 0. 005. 所 以 令 p, = p; 20.03, nj =m =n, 求解 下 列 关于 
n 的 方程 可 以 得 到 每 台 机 器 要 求 的 样本 容量 ，: 


650 


P14d1 P242 
H =z,20(, -b,) 或 H=¿,p PE + 一 一 
1 n> 





0. 005 = 1. 96 





(0. 03) (0. 97) + (0. 03) (0. 97) 


n 


0. 005 - 1. 9s, /2(9- 03) (0. 97) 
n 


n» - (1:96)? (2) (0. 03) (0. 97) 
I (0.005)2 





=8 943 





O 由 经 验 法 则 , 我 们 期 望 大 约 95% 的 观测 值 落 在 1 - 20* lu +2 内, 因此， 极 差 (jy+20) - Qc 720) =40. 
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由 此 可 见 , 这 可 能 是 一 个 烦琐 的 抽样 过 程 . 如 果 质 检 员 坚持 0.95 的 概率 要 求 估计 (Pi — p; ) 精确 到 
0. 005 以 内 , 他 必须 对 每 台 机 器 检查 大 约 9 000 件 产品 . 

从 例 7. 18 的 计算 中 可 见 ， C (5; -六 ) (因此 解 ni =n; = n) KF pi 和 P2 的 真实 (但 未 知 ) 值 . 事实 
E, 当 pi =p =0.5 时 , 要 求 的 样本 容量 n =n, =n 是 最 大 的 . 因此 ， 如 果 你 对 pl 和 ps 的 近似 值 没有 任 
何 先 验 信息 , 在 o, Arb, Hpi =p =0.5. MUR p; Mp 实际 上 接近 0.5, 此 时 得 到 的 Rn, 
的 值 将 是 正确 的 . 如 果 p. 和 p, 完全 不 同 于 0.5, 那么 m 和 no 的 解 将 比 实际 需要 的 大 . 所 以 在 求解 n, 
Fl n; 时 , 用 pi =p 20.5 是 保守 的 方法 , 因为 样本 容量 ni 和 m 至 少 如 (可 能 超过 ) 所 需 的 那样 大 . 

下 面 给 出 的 估计 参数 人 ， (Mi - ua) ,Pp 和 (pi -ps) 时 所 需 的 样本 容量 的 计算 公式 中 . 合计 方差 时 
所 需 的 样本 容量 计算 公式 比较 难 , 超出 了 本 书 的 研究 范围 


为 了 以 (1-e) 的 概率 ,估计 总 体 均值 zc 在 H +f, 选择 样本 容量 


Ep A 
n = (%22) 





(GR: 总 体 标准 差 o 常 是 近似 的 . ) 








为 了 以 (1 -o) 的 概率 ,估计 成 对 总 体 均值 差 j， -Kz 恰好 在 五 个 单位 内 , 选择 样本 容量 


2 
m =m = (52) (a? +o) 


KP n fe n, 是 从 两 个 总 体 中 抽样 的 观测 值 个 数 ， 01 fa o; 是 两 个 总 体 的 方差 




















为 了 以 {1 -a) 的 概率 , 估计 总 体 比 率 p 在 妃 个 单位 内 ,选择 样本 容量 





其 中 己 是 你 试图 估计 的 总 体 比率 ,g =1 p. 
GRE: 这 个 算法 要 求 事 先 估计 p 和 g. 如 果 对 p faq 一 无 所 知 , 利用 p=g=0.5 H n 的 保守 选择 ，) 








为 了 以 (1 -a) 的 概率 ， 估计 两 个 总 体 比率 差 (p， -P EHTA, 选择 样本 容量 
n =m = (=) (piq, +p.q.) 
XP p, f p, 分 别 是 总 体 1 和 2 的 比率 ,mu fun, 是 从 每 个 总 体 中 抽样 的 观测 值 个 数 . 


应 用 练习 
7.81 放射 性 地 衣 . 参考 练习 7. 29， 阿拉 斯 加 州 地 衣 














计算 为 得 到 要 求 的 估计 所 需 的 样本 容量 . 
7.82 失火 引起 的 铝 制 继 污 点 . 坐落 在 佛罗里达 州 


放射 性 基线 的 研究 . XE n 29 个 地 衣 样 品 的 样本 , BE 
究 者 计算 放射 性 元 素 馅 - 137 含量 的 平均 值 和 方差 分 
别 是 0. 009 和 0. 005 微 居 里 /毫升 . 假定 研究 者 想 增 
加 样本 容量 , 使 得 估计 均值 在 它 的 真 值 0 001 微 
居 里 /毫升 以 内 , 利用 95% 置信 区 间 . 

a， 研 究 者 要 求 的 置信 水 平 是 什么 ? 

b. 研究 者 希望 的 抽样 误差 是 什么 ? 


坛 帕 内 的 一 个 巨大 商品 仓库 储存 了 将 近 6 000 万 
个 空 饭 制 啤酒 和 汽水 继 . 最 近 , 这 个 仓库 失火 ， 许 
多 铝 饶 被 烟 寺 留 下 黑 点 不 能 使 用 . 保险 公司 聘请 
南 佛罗里达 大 学 的 统计 学 家 估计 仓库 内 被 火 重 黑 
FO FRE RU SE Es LESE p. 以 90% 的 置信 和 度 估 计 实 际 
比率 在 0.02 以 内 ， 需要 随机 抽取 多 少 个 铝 制 
EHE? 


7.83 瓶装 水 中 的 细菌 . 你 喝 的 瓶装 水 安全 吗 ? 依据 


J] E 45 Ë BE 
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发 表 在 U. S. News & World Report (1999 Æ 4 H 12 
日 ) 上 的 一 篇 文章 ,自然 资源 保护 协会 警告 说 ,你 
喝 的 瓶装 水 可 能 含有 超过 州 和 美国 联邦 法 规 允 许 
的 细菌 数 和 其 他 可 能 的 致癌 化 学 物质 . 在 对 1 000 
多 瓶 瓶 装 水 的 研究 中 , 大 约 有 1⁄3 超出 政府 规定 的 
标准 . 假定 自然 资源 保护 协会 想得到 至 少 违反 一 项 
政府 规定 标准 的 瓶装 水 的 总 体 比 率 的 最 新 估计 上 
限 . 为 以 99% 置信 度 在 +0.01 以 内 估计 这 个 比率 ， 
确定 所 需 的 样本 容量 (瓶装 水 的 数量 ). 

7.84 烤箱 访 调 研究 . 参考 练习 7.32. 以 95% 的 置信 
度 估计 烤箱 毫 调 或 烘 烤 产 生 的 细微 颗粒 平均 衰退 
速度 在 0.04 以 内 , 需要 选取 多 大 的 样本 ? 

7.85 地 下 井 水 污染 . 参考 练习 7.60，Frwironmental 
Science & Technology(2005 年 1 月 ) 关 于 新 罕 布什 尔 州 
井 水 被 甲 基 叔 乙 基 醚 (MTIBE ) 污染 的 研究 . 为 了 以 
95% 的 置信 和 度 估计 可 检测 到 MTBE 水 平井 的 比率 之 差 
在 0.06 之 内 , 必须 抽样 多 少 口 公有 并 和 私有 并 ? 

7.86 高 强度 铝 合金 . 参考 练习 7.37, JOM(2008 年 1 
月 ) 关 于 一 种 新 型 高 强度 RAA 铝 合金 与 目前 最 强 铝 
合金 的 比较 . 假定 研究 者 希望 以 95% 的 置信 和 度 估计 
两 种 铝 合 金平 均 强 度 之 差 在 15 MPa 以 内 . 为 得 到 所 


要 求 的 估计 , 每 类 必须 检验 多 少 个 合金 样品 ? 

7.87 铁 矿 石 交 付 批 的 抽样 . 大 型 钢铁 厂 进行 一 项 试 
验 以 比较 两 个 铁 矿 石 交付 批 的 平均 含 铁 量 . 按照 工 
业 标 准 , 随机 从 每 种 交付 批 中 抽取 个 铁 矿 石 样品 
测量 含 铁 量 . 根据 以 前 的 试验 , 知道 铁 含量 的 变化 
范围 大 约 是 3%. 如 果 钢 铁 厂 希 望 以 95% 的 置信 和 度 
估计 两 个 交付 批 的 平均 铁 含量 之 差 在 0.05% 之 内 ， 
n 应 该 多 大 ? (MUR: ATR o, 和 o, 的 近似 值 ， 
令 o == =e 且 令 极 盖 = 4o, WAF 3 =~ 40 


Ro. ) 


N 


.88 有 缺陷 的 电线 . 消费 者 保护 组 织 想 比 较 两 个 电 
气 承包 高 的 工作 , 以 评价 他 们 的 安全 记录 . 该 组 织 
计划 通过 调查 这 两 个 承包 商工 作 过 地 区 的 居民 来 估 
计 有 电气 缺陷 的 居民 比率 之 差 . 假定 每 个 电工 的 接 
线 缺 陷 比 率 期 望 大 约 是 0. 10. 以 95% 的 置信 和 度 , 使 
估计 的 比率 差 在 0.05 以 内 , 需要 调查 多 少 个 住户 ? 


理论 练习 
7.89 ”在 确定 为 估计 p 所 需 的 样本 容量 时 ,证明 : 当 
p=0.5 时 , 样本 容量 ”是 最 大 的 


“7.12 其 他 区 间 估 计 方 法 : 自助 法 和 贝 叶 斯 法 
在 7.4 ~7. 10 节 中 , 使 用 了 求 总 体 参数 置信 区 间 的 经 典 统计 方法 . 此 方法 的 关键 是 求 感 兴趣 的 
总 体 参数 的 枢 轴 统计 量 (7. 3 节 的 定义 ). 由 于 枢 轴 统 计量 的 概率 分 布 已 知 (对 大 样本 应 用 中 心 极限 定 
理 , 对 小 样本 作 总 体 数据 的 假定 ) , 枢 轴 统计 量 的 概率 表达 式 用 于 求 置 信 区 间 的 上 下 端点 
在 本 节 中 , 我 们 介绍 另外 两 种 不 同 的 区 间 估计 方法 : 自助 法 和 贝 叶 斯 法 , 在 一 定 的 抽样 条 件 下 
这 两 种 方法 或 其 中 的 一 种 可 以 为 目标 参数 提供 更 窄 的 或 /和 更 加 有 效 的 置信 区 间 . 


自助 法 置信 区 间 


自助 法 ,由 布雷 德 利 . 埃 夫 朗 ( Bradley Efron, 1979) 提出 ， 也 称 作 重复 抽样 的 蒙特 卡 罗 方 法 ， 即 
从 原始 样本 数据 中 , 重复 抽取 (有 放 回 ) 容量 为 的 样本 . 埃 夫 朗 所 用 的 自 助 一 词 来 源 于 “依靠 自己 的 
力量 把 自己 提起 来 "; 因此 , 很 形象 地 描述 了 一 种 基于 计算 机 技术 的 方法 ， 即使 在 数据 不 满足 基本 假 


定 的 抽样 情况 下 也 能 得 到 可 靠 的 推断 . 
É y, |Y2s Y3, 77 
法 求 的 置信 区 间 的 步骤 如 下 : 


， ya 表示 取 自 有 未 知 均值 E(Y) =u 的 总 体 、 大 小 为 n 的 一 个 随机 样本 . 用 自助 


步骤 1 选择 其 中 j 是 重复 抽样 的 次 数 . (通常 ,j 是 一 个 非常 大 的 数 ， 如 j=1 000 或 j=3 000. ) 


步 最 2 来 自 原始 样本 数据 集合 yr, y, ya, 


， Yn 的 n 个 了 值 的 有 放 回 随 机 抽样 称 为 重复 抽 


KE. Cè: 因为 是 有 放 回 抽样 , 有 可 能 出 现 单个 样本 观测 值 是 同 -- 了 值 的 多 重 值 . ) 
BURG 重复 / 次 步骤 2， 计算 每 次 的 样本 平均 值 子 


步骤 4 BY, Y2, ys, Ut 
10. y 的 真实 抽样 分 布 . 


' 妨 表 示 来 自重 复 抽样 的 7 个 样本 均值 . 这 些 样本 均值 的 (模拟 ) 分 布 近 
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步骤 5 求 步 又 4 得 到 的 了 的 模拟 抽样 分 布 的 (近似 ) (a/2)100% 和 (1 -oa/2)100% 的 百 分 位 数 . 
这 两 个 百 分 位 数 分 别 表示 风 的 近似 (1 -a)100% 置信 区 间 的 下 限 与 上 限 . 

按照 这 种 方法 的 初步 说 明 , 还 不 能 马上 明白 为 什么 对 样本 的 重复 抽样 能 得 到 可 靠 的 估计 和 正确 
的 置信 区 间 . 关键 是 理解 仅 有 的 关于 样本 均值 了 的 抽样 变异 性 信息 就 在 样本 之 中 . 所 以 , 通过 对 样本 
重复 抽样 , 模拟 了 围绕 7 的 实际 变异 性 . 当然 , 我 们 需要 计算 机 来 执行 数 以 千 计 的 重复 抽样 ， 以 得 到 
y 的 抽样 分 布 的 较 好 近似 . 

我 们 用 下 面 的 例子 来 解释 上 述 自助 法 步骤 . 
参考 例 7. 2 关于 猫 听觉 神经 纤维 反应 速度 的 研究 . 随机 测量 了 10 只 猫 的 数据 (对 突 发 噪音 
每 200 ms 的 脉冲 数 ) 见 表 7. 11. 用 这 些 数据 估计 真实 的 平均 反应 7.1 听觉 神经 纤维 反应 速度 
速度 A. 因为 样本 容量 很 小 (= 10) , 为 使 7.3 节 小 样本 置信 区 151 156 120 192 161 
间 方 法 有 效 , 抽样 总 体 必 须 近 似 正 态 分 布 . 但 是 我 们 知道 反应 速 ERES IL83 187 171 172 
度 了 是 近似 泊 松 分 布 的 . 因此 在 这 种 抽样 情况 下 不 满足 正 态 性 假定 . 用 自助 法 可 以 得 到 和 的 正确 的 
90% 置信 区 间 . 

解 为 了 得 到 自助 置信 区 间 , 按照 上 面 介绍 的 步 又 进行 . 

步骤 1 选择 j=3 000 次 重复 抽样 . 

步骤 2~3 从 表 7.11 的 样本 数据 中 用 SAS 程序 (有 放 回 地 选取 观测 值 ) 产 生 大 小 为 n=10 的 
3 000 个 随机 样本 . 前 5 次 重复 抽样 的 反应 速度 数据 见 表 7. 12. 

表 7. 12 对 表 7. 11 数据 中 的 自助 法 抽样 (前 5 个 样本 ) 


样本 1 12.0 11.3 18.7 17.2 17.2 11.3 17.1 17.2 17.1 14.6 
样本 2 15.1 19.2 18.7 14.6 11.3 17.1 17.2 14.6 12.0 16.1 
样本 3 17.2 18.7 15.1 14.6 11.3 15.1 17.1 16.1 17.1 15.1 
样本 4 15.1 15.1 18.7 15.5 16.1 17.1 14.6 19.2 19.2 17.2 


样本 5 _ 17.1 15.1 15.1 17.2 19.2 18.7 17.1 16.1 19.2 — 192 
T2 392 187 UL 161 — 192 — 192 - 
$8 3-4 用 SAS 程序 计算 每 个 样本 的 样本 均值 了 这 3 000 个 样本 均值 的 概括 统计 量 见 图 
7.16 的 SAS 输出 . 


The UNIVARIATE Procedure 
Variable: YBAR 


Moments 
N 3000 Sum Weights 3000 
Mean 15.6907033 Sum Observations 47072.1 
Std Deviation 0.79486784 Variance 0.63181488 
Skewness -0.0969683 Kurtos is -0.0683272 
Uncorrec ted SS 740489 .326 Corrected SS 1894.81282 
Coeff Variation 5.086585218 Std Error Mean 0.01451223 
Basic Statistical lleasures 
Locat ion Variability 
Mean 15.69070 Std Deviation 0.79487 
Median 15.70000 Variance 0.63181 
Mode 15.37000 Range 4.89000 
Interquartile Range 1.05000 


Quantiles (Definition 5) 


Quantile Estimate 
100X Ma 18.110 
17.5 
95x 16.980 
90x 16.690 
752 Q3 16.230 
50X Media 15.700 
25x Q1 15.180 
10x 14.645 
5x 14.300 
X 13.750 
0X Min 13.220 











图 7. 16 样本 均值 7 的 3 000 个 自助 值 的 SAS 概括 统计 量 
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步骤 5 对 90% 和 置信 区 间 , a =0.10, a/2 =0.05, (1 - ov2) 20.95. 所 以 , 总 体 均值 的 自助 
90% 置信 区 间 要 求 我 们 得 到 7 的 抽样 分 布 的 第 5 和 第 95 百 分 位 数 . 这 两 个 百 分 位 数 在 图 7. 16 着 重 
显示 . 第 5 百 分 位 数 是 14.30, 第 95 百 分 位 数 是 16.98. 因此 , À 的 自助 90% 置信 区 间 是 (14. 30， 
16. 98). 

对 任意 总 体 参数 09( 如 8=o?, 6-1, -js, 等 等 ) 自 助 置信 区 间 的 求法 与 估计 4 的 方法 类 似 , 步 
又 见 下面 的 框 格 . 





总 体 参 数 9 的 自助 置信 区 间 

Ë y, ys, UU, Y, 表示 取 自 有 未 知 参数 8 的 总 体 概率 分 布 随 机 变量 了 的 有 个 观测 信和 的 随机 样本 . 1 ó 
表示 8 的 样本 估计 . 

用 自助 法 求 6 的 置信 区 间 的 步骤 如 下 : 

步骤 1 选择) 这里] 是 重复 抽样 的 次 数 . 

步骤 2 从 原始 样本 数据 集 y1，,y,, Y, t, Yn, 用 有 放 回 方法 重复 抽样 了 的 nn 个 值 

步骤 3 重复 第 2 步 共 次 ,计算 每 次 的 只 

PRA 设 0，0.，…，6 表示 1 个 重复 抽样 的 样本 估计 值 

BRS 用 步骤 4 的 样本 值 , RO 的 模拟 抽样 分 布 的 (近似 ) (872) 10096 8 (1 - a/2)100% 百 分 位 数 这 
两 个 百 分 位 数 分 别 表示 8 的 近似 (1 -a)100% 置 信 区 间 的 下 端点 与 上 端点 












































用 框 格 中 方法 生成 的 置信 区 间 叫 做 百 分 位 数 自助 置信 区 间 . 还 有 一 些 用 自 助 法 产生 置信 区 间 的 
其 他 算法 , 如 自助 1 区间、BC。 自助 区 间 和 ABC 自助 区 间 . 这 些 都 超出 了 本 书 的 范围 . 关于 如 何 利 用 
这 些 方 法 的 细节 , 请 参考 有 关 资 料 . 

贝 叶 斯 估计 法 

在 7.3 节 中 , 我 们 介绍 了 贝 叶 斯 统计 方法 一 一 应 用 “ 贝 叶 斯 法 则 ” 的 逻辑 进行 统计 推断 的 方法 . 
对 于 估计 某 个 总 体 参数 9 的 问题 , 贝 叶 斯 方法 将 9 看 做 一 个 具有 某 已 知 概率 分 布 h( 0) 的 随机 变量 . 
换 句 话说 , 在 抽样 之 前 , 通过 选取 9 的 一 个 合适 的 概率 分 布 ， 贝 叶 斯 方法 确定 了 9 取 某 个 值 的 可 能 
性 . 因此 , h( 0) STE 8 的 先 验 分 布 . 

4 yi, Yay Yas s Yn 表示 取 自 有 未 知 参数 0 的 总 体 大 小 为 n 的 随机 样本 . UE f(yi, yo, ya, s 
Yn | 9) 表 示 给 定 6 后 样本 值 的 联合 条 件 概率 分 布 , h( ORRO 的 先 验 分 布 . 求 6 的 贝 叶 斯 估计 的 关键 
是 条 件 分 布 g(8 1 yi Ya, Ya, o, Yn) 称 作 0 的 后 验 分 布 . 应 用 贝 叶 斯 法 则 ， 可 以 证 明 ( 证 明 略 ) 
后 验 分 布 是 : 





fon, Ya: Y35 7, Yn | 0) * h( 0) 
fn, 325 Y35 7, Yn) 


其 中 fyi， ya, Xy, s Yn) = fy, Yrs Y3as "^, Yn | 0) ` A(0)d6. 





goly, Yos Ya, ts Yn) = 


一 旦 后 验 分 布 g(0 yy, yz, ys, t, y WARE, 9 的 贝 叶 斯 估计 ( 记 作 6, ) 也 就 可 以 适当 选取 . 例 
An, Ôp 可 以 是 后 验 分 布 的 均值 或 后 验 分 布 的 中 位 数 . 
贝 叶 斯 方法 通常 对 选择 一 个 与 0 的 真 值 相 差 甚 远 的 6, 值 进行 惩罚 . 通常 是 用 平方 误差 损失 范 
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数 , 这 里 损失 是 上 =(6-0)2. 那么 9 的 估计 将 是 使 二 达到 最 小 的 那个 值 . 可 以 证 明 ( 证 明 略 ), 使 平 


方 误差 损失 最 小 的 Os 就 是 后 验 分 布 的 均值 , 记 作 ECO | Ys, Yo, Y). 

我 们 用 下 面 的 例子 来 说 明 贝 叶 斯 方法 . 
HY. yas Yos rs y, 表示 来 自 具有 未 知 成 功 概率 p 的 伯 努 利 概率 分 布 的 容量 为 n B B 
机 样本 . 蕊 表示 伯 努 利 值 的 和 , 和 = Xy; (由 4.6 节 ) 我 们 知道 了 服从 参数 为 n 和 p 的 二 项 分 布 , 用 平 
方 误差 损失 函数 求 p 的 贝 叶 斯 估计 . 假定 p 的 先 验 分 布 是 参数 为 = 1, B =2 的 有 概率 分 布 . 

解 ”因为 已 知 蕊 服从 一 个 离散 的 二 项 分 布 (在 给 定 六 和 的 条 件 下 ) , p 服从 连续 的 B 分 布 (a = 
1, 8-2), 我 们 有 : 





pla |n, p) = (Tea =p)", O=x=n 
hp) -LO +OP U =p) rG) =p)’ 
PT T(a)T(B) r()rQ) 
z2(1-p), 0«p«l1 


p BERIEM X =x 条 件 下 ) 是 : 
g(p|x)=p(x|p) * h(p)/p(x) 
后 验 分 布 的 分 母 是 : 


p(x) = W: |p) * h(p)dp = f ea - p)" *2(1-p)dp = x (^f, a - p)'7**ldp 


注意 到 , 被 积 表达 式 是 w=(x+1),8=(n-x+2) 的 B 分布 . 所以, 1Z EF T(o)T(8)/T (a * B) = 
D(x-1)P(n-x42)/T(n*3). 因此 , RITE: 


p(x) = xf a - py dp = 2(7)TG + DEG -x € 2)/T(n +3) 
现在 , K p 的 后 验 分 布 : 


(ea -D2 -PTCn+3) 





g(p|x) =p(x |n, p) * h(p)/p(x) = 
I 2(^jrG D TQ -2 +2) 
-p'(1-p)"7**!T(n«3)/[T(x*1)T(n-x42)] 
可 见 glp |x) 有 a=(x+1),B=(n-x+2) 的 B 分 布 形式 . 对 平方 误差 损失 函数 ,p 的 贝 叶 斯 估 
计 是 这 个 条 件 分 布 的 均值 . B 分 布 的 均值 是 a/(a+B). 因此 , p 的 贝 叶 斯 估计 是 : 
Pp=a/(a+B)=(x+1)/[x+l+n-x+2] =(x+1)/(n+3) 
经 整理 ， 上 述 表 达 式 可 写成 ， 


by eG rem e (gr) G9) "Gs + C8) 3] 


注意 , [3/(n+3)] 是 a=1, B=2 的 B 分 布 的 均值 . 因此 , p 的 贝 叶 斯 估计 是 样本 均值 x* 和 p 的 先 验 
概率 分 布 均值 的 简单 加 权 平 均 . 

参数 9 的 贝 叶 斯 区 间 估 计 也 能 从 9 的 后 验 条 件 概率 分 布 推 得 . 这 些 区 间 称 作 可 信 区 间 ( 或 概率 区 
iB), 形式 如 下 : 





用 置信 区 闻 估 计 
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区 间 的 下 限 工 和 上 限 U 是 样本 了 的 函数 , 应 选择 


U 
P(L <0 < U) - f, g(Olyi, Y2, ya, =, y,)d0 


择 L 和 U0 使 9 在 这 个 区 间 内 的 概率 是 0.95( 辟 如 


说 ). 例如 , 假定 9 的 后 验 分 布 是 自由 度 为 yz=22y; 的 ?分 布 . 为 了 保证 P(L<0<U) =0.95, L 
各 分 别 是 忆 分 布 的 第 2. 5 和 第 97. 5 百 分 位 数 . 关于 如 何 得 到 贝 叶 斯 概率 区 间 的 更 多 内 容 ， 请 


参考 有 关 文 献 . 
应 用 练习 
7.90 IA + FRP 条 的 承重 强度 . 参考 练习 2.37, 


N 


Composites Fabrication Magazine ( 2004 年 9 月 ) 关 于 
纤维 增强 聚合 物 (FRP) 合成 材料 的 强度 研究 . 检测 
了 用 机 械 方法 固定 在 高 速 路 桥梁 上 的 10 根 拉 挤 
FRP 条 的 承重 强度 (单位 MPa) 数 据 见 下 表 . 用 自助 
法 求 用 机 械 方 法 固定 FRP 条 真实 平均 强度 的 90% 
置信 区 间 . 

———————————————— —— 
240. 9 248. 8 215. 7 233. 6 231.4 230.9 225.3 247. 3 235. 5238.0 


资料 来 源 : Data are simulated from summary information pro- 
vided in Composites Fabrication Magazine , Sept. 2004, p. 32 
(Table 1). 


.91 新 泽 西 井 水 的 污染 ， 参考 练习 7. 27, Environ- 


mental Science & Technology (2005 年 1 月 ) 关 于 新 泽 
西 加 油 站 附近 水 井 污染 的 研究 . 表 中 给 出 了 12 H 
JFRSHI AE T 3EBE( MTBE) 含量 数据 ( 百 万 分 之 
一 ) 用 自助 法 求 新 泽 西 加 油 站 附近 水 井 的 MTBE 
平均 含量 的 99% 置信 区 间 . 比较 自助 区 间 与 练习 
7.27b 的 置信 区 间 . 





-92 ”估计 冰 磺 物 的 年 代 . 参考 练习 7.56，4merican 


Journal of Science(2005 4E 1 H ) 关 于 威斯康星 州 沉 

积 的 冰 厂 物化 学 成 分 的 研究 . 26 fk yK E W rh zn 

CAD RISE ( Be) 的 比 数 据 见 下 表 . 

a 用 自助 法 求 所 有 冰 奢 物 中 AV Be 超过 4 5 的 真 
实 比 率 , 用 95% 置信 区 间 . 

b， 比 较 自 助 区 间 与 练习 7. 56b 得 到 的 置信 区 间 ， 
为 什么 自助 置信 区 间 更 加 合适 ? 

OC 


3.76 4.05 3.81 3.23 3.13 3.30 3.21 3.32 4.09 3.00 5.06 3.85 3.88 





. 95 É y, >, s, 7 Yn 


(5E) 


4.06 4.56 3.60 3.27 4.09 3.38 3.37 2.73 2.95 225 2.73 2.55 3.06 








资料 来 源 : Adapted from American Journal of Science, Vol. 
305, No. 1, Jan. 2005, p. 16( Table 2). 


.93 ”和 白光 干扰 测量 技术 . 在 要 求 高 精度 的 地 表 高 度 


地 图 中 ,白光 干扰 测量 技术 ( WLI) 已 经 成 为 一 个 标 
准 检 测 工具 . 因为 WL 产生 二 维 海拔 轮廓 ,而 WII 
所 用 的 标准 机 械 设备 只 能 产生 一 维 轮廓 , 工程 师 
们 必须 估计 WLI 地 表 图 生成 像素 的 平均 高 度 . 在 
Optical Engineering( 2005 年 1 月 ) 中 , 德国 研究 者 应 
用 员 时 斯 法 来 解决 这 个 问题 . 研究 的 简化 形式 叙述 
如 下 : 令 了 表示 由 WII 产生 的 像素 高 度 . 假定 了 以 
IE p 取 1, 以 概率 1 - p 取 0. 再 假定 p 服从 参数 
为 a=1,B=2 的 BB 分布. 现在 令 y, n, 
Ys, ccs Y AERIS Y W n A GERE AS P E RE, 如 果 
y -0. 80. 用 平方 误差 损失 函数 求 p 的 贝 叶 斯 估计 . 
(提示 : 用 例 7. 20 的 结果 . ) 


© 理论 练习 
7. 94 


Wy», s, VU, Y, 表示 未 知 均值 为 和 的 泊 松 
概率 分 布 的 一 个 容量 为 ”的 随机 样本 , X 表示 泊 松 值 
的 和 (X= ZY,). 那么 ,了 服从 均值 为 nA 的 泊 松 分 布 . 
假定 À 的 先 验 分 布 是 参数 为 6 的 指数 概率 分 布 . 

a. 求 后 验 分 布 g(A | x). 

b， 用 平方 误差 损失 函数 求 A 的 贝 叶 斯 估计 . 
表示 未 知 均值 为 1 方差 
Ai o° =1 的 正 态 概率 分 布 的 一 个 容量 为 n 的 随机 
样本 . 那么 样本 均值 了 服从 均值 为 凡 , 方差 为 o2 = 
1/n 的 正 态 分 布 . 假定 的 先 验 分 布 是 均值 为 5、 方 
差 为 1 WESH. 

a. RERA glu | y). 

b.， 用 平方 误差 损失 函数 , 证 明 ; 的 贝 叶 斯 估计 是 
7 与 先 验 分 布 的 均值 5 的 加 权 平 均 . 
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° 总 体 参 数 9 的 最 小 方差 无 偏 估计 (MVUE) 在 所 有 无 偏 估计 中 具有 最 小 的 方差. 
* 估计 方法 : 枢 轴 法 (算法 或 者 极 大 似 然 法 ) 、 刀 切 法 、 稳 健 估计 法 、 自 助 法 和 贝 叶 斯 法 . 


。 置 信 区 间 





以 一 定 的 置信 水 平 包含 总 体 未 知 参数 的 区 间 . 


。 置信 系数 一 一 随机 选择 的 置信 区 间 包含 总 体 参数 值 的 概率 . 
* 术语“(1 -a)100% 和 置信"“ 的 解释 : 在 重复 抽样 中 , 所 有 类 似 构造 的 区 间 的 (1 - a) 10096 38 8 


含 参数 的 真 值 . 
° 将 人 作为 感 兴趣 参数 ( 均值、 平均) 的 关键 词 . 
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符号 汇集 
" 8 E 法 说 mW 
0 theta 一 般 的 总 体 参数 
ô theta- hat 总 体 参数 的 点 估计 
ó ó 计量 9 
d bs EET 
p 总 体 比率 
H 置信 区 间 的 半 宽 
a alpha (1 - a) 表示 置 信 系数 
Zan 用 于 100(1 -a)% 大 样本 置信 区 间 的 z 值 
ly 用 于 1001 -a)% 小 样本 置信 区 间 的 : 值 
y y-bar 样本 均值 ; u 的 点 估计 
à p-hat 样本 比率 ; p 的 点 估计 
o? sigma 平方 总 体 方差 
s 样本 方差 ; o^ 的 点 估计 
v nu t #l 统计 量 的 自由 度 
Hi 一 Na mu-1 减 mu-2 总 体 均值 之 差 
yi 一 入 y- bar-1 减 y-bar-2 样本 均值 之 差 ; u -pw 的 点 估计 
E ep X 合并 的 样本 方差 
N mu d 总 体 均值 之 差 , 配对 数据 
d y-bar 样本 差 的 均值 ; ps 的 点 估计 
Sa s-d 样本 差 的 标准 差 
Pi - p> p-1 W p-2 总 体 比率 之 差 
Pi -P p-1 hat 9 p-2 hat 样本 比率 之 差 ; py -pz 的 点 估计 
F, F-alpha 相应 于 尾部 面积 oc 的 严 分 布 临界 值 
vi nu-1 屎 统计 量 的 分 子 自 由 度 
V3 nu-2 统计 量 的 分 母 自由 度 
z sigma-1 平方 与 sigma-2 平方 的 比 两 个 总 体 方差 之 比 
m, m-k k MFE 
E(y) k EEE 
L 似 然 函数 
6, theta- hat i 由 删 去 第 i 个 观测 值 所 得 的 点 估计 
LCL 置信 下 限 
UCL 置信 上 限 
Xan 2 分 之 a 的 x 用 于 100(1 - a)% 置 信 区 间 的 x? 值 
—— — II A A — NH 得 
本 章 总 结 提示 
° 总 体 参数 0 的 点 估计 9 是 无 偏 的 , 如果 E(0) = 6; 否则 , 估计 是 有 偏 的 . 
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° Hiu -m 作为 感 兴趣 参数 (均值 或 平均 之 差 、 用 独立 样本 比较 两 个 均值 ) 的 关键 词 /术语 . 
° 将 wa 作为 感 兴趣 参数 (配对 差 的 均值 或 平均 、 用 配对 比较 两 个 均值 ) 的 关键 词 /术语 . 

° 将 p 作为 感 兴趣 参数 ( 比率、 百分数 、 比 ) 的 关键 词 . 

° 将 pl -ps 作为 感 兴趣 参数 ( 比率 或 百分数 之 差 、 用 独立 样本 比较 两 个 比率 ) 的 关键 词 /术语 
° 将 o? 作为 感 兴趣 参数 (方差 、 散布、 变异 ) 的 关键 词 . 

° 将 oi/ o5 作为 感 兴趣 参数 (方差 之 比 、 用 独立 样本 比较 两 个 总 体 的 方差 ) 的 关键 词 /术语 . 


补充 练习 


96 被 动 抽样 器 的 效率 . 西班牙 梅 西亚 大 学 的 化 学 

工程 师 做 了 一 系列 试验 ,以 确定 用 于 被 动 抽样 器 

的 最 有 效 的 隔膜 ( Environmental Science & Technolo- 

gy, Vol. 27, 1993). 被 动 抽样 器 的 效率 是 用 抽样 速 

度 (em /min) 度 量 的 . 在 一 次 试验 中 , 放置 6 台 被 

动 抽样 器 , 使 它们 的 面 与 空气 流 平行 . 空气 流速 是 

90 cm /s. 6 h 后, 测量 每 一 台 的 抽样 速度 . 根据 这 

些 结果 计算 平均 抽样 速度 的 95% 置信 区 间 是 

(49.66, 51.48). 

a. 这 个 区 间 的 置信 系数 是 多 少 ? 

b. 给 出 a 中 置信 系数 的 理论 解释 . 

c 给 出 置信 区 间 的 实际 解释 . 

d. 为 使 这 个 区 间 能 给 出 有 效 的 推断 ,需要 满足 的 
假定 是 什么 ? 


.97 水 污染 检测 . EPA 希望 检测 随机 抽取 的 nn 个 水 


样品 的 样本 , 并 估计 由 于 采矿 作业 导致 的 平均 日 
污染 速度 如果 EPA 想 以 抽样 误差 1 mg/L 的 
SPEAK, 需要 抽取 多 少 个 水 样品 ”假定 
先 验 知识 指出 在 一 天 内 所 取 的 水 样本 污染 读数 是 
标准 差 等 于 5(mg/L) 的 近似 正 态 分 布 . 


98 黄蜂 的 同系 繁殖 . 与 蚂蚁 和 蜜蜂 一 样 , 热带 群 


居 黄 蜂 依 靠 工蜂 养育 幼 蜂 , 对 这 种 特殊 行为 的 -个 

可 能 解释 是 同系 繁殖 ， 这 加 强 了 黄蜂 之 间 的 相互 

关系 , 并 且 容 易 挑选 出 工蜂 来 帮助 它们 最 接近 的 

亲友 . 为 了 证 实 这 个 理论 , 在 委内瑞拉 捕获 了 197 

窝 群 居 黄 蜂 . 经 -70% 冷 冻 后 ,进行 了 一 系列 的 遗 

传 学 试验 ( Science, 1998 年 11 H). 对 每 个 黄蜂 样 

品 数据 用 于 生成 同系 繁殖 系数 x, 得 到 以 下 结果 : 

x =0. 044, s = 0. 884. 

a 构造 这 种 黄蜂 的 平均 同系 繁殖 系数 的 90% 置信 
区 间 . 

b. 系数 0 表示 这 个 黄蜂 无 同系 繁殖 的 趋势 . 用 a 的 
置信 区 间 推 断 这 种 黄蜂 的 同系 繁殖 趋势 . 

99 仪器 的 准确 度 和 精密 度 . 当 用 一 台新 开发 的 仪 

器 做 产品 (食物 、 药 品 等 ) 的 化 学 分 析 时 , 经 常 需要 


N 


. 101 


评估 仪器 的 两 个 标准 : 准确 度 和 精密 度 . 准确 度 是 
反映 仪器 正确 识别 产品 成 分 的 性 质 和 数量 的 能 力 . 
精密 度 是 指 在 鉴别 相同 物质 成 分 时 仪器 的 一 致 性 . 
因此 , 产品 的 单个 样本 识别 中 较 大 的 变异 性 表明 
仪器 的 精度 不 足 . 假定 一 个 制药 厂 考虑 用 两 种 商标 
的 仪器 来 鉴定 某 种 药品 的 成 分 . 作为 精密 度 比较 的 
一 部 分 , 选取 一 批 充分 混合 药品 的 10 个 试管 检验 
样品 . 用 仪器 A 分 析 其 中 的 5 个 , 用 仪器 B 分 析 另 
外 的 5 个 . 下 表 中 的 数据 是 由 两 种 仪器 测量 的 药物 





基本 成 分 的 百分数 . 
人 器 A Ba 4B 3] 2 p 
仪器 也 46 49 43 41 48 


a. 构造 90% 置 信 区 间 比 较 两 种 仪器 的 精密 度 . 

b. 依据 a 的 置信 区 间 ， 你 对 两 种 仪器 的 精密 度 作 

出 什么 推断 ? 

e. 为 保证 由 估计 值 导出 的 任意 推断 的 有 效 性 ， 必 
须 满足 的 假定 是 什么 ? 


.100 人工 物 料 搬运 , 参考 练习 2.72, 人 工 物料 搬 


运 活动 的 承载 力 准 则 . 观测 随机 抽取 的 男性 和 女性 
能 安全 从 地 上 提 到 膝 高 的 最 大 重量 来 建立 准则 
(Human Factors, 1980 年 6 J). 当 以 每 分 钟 次 的 
速度 提起 物品 时 , 男性 提起 的 平均 最 大 重量 是 

30. 25 kg, 标准 差 是 8. 56 kg, 而 女性 提起 的 平均 最 

大 重量 是 19.79 kg, 标准 差 是 3. 11 kg. 

a 假定 样本 由 60 名 男性 和 60 名 女性 组 成 , 构造 
男性 和 女性 能 够 安全 提起 的 最 大 重量 方差 比 的 
90% 置信 区 间 . 

b. 为 保证 a 中 区 间 估 计 的 有 效 性 , 必须 满足 的 假 
定 是 什么 ? 

盖 房 受伤 . 参考 加 利 福 尼 亚 劳动 调查 和 统计 

部 门 的 研究 , 盖 房 是 最 危险 的 工作 之 一 . 在 2 514 

名 受伤 致 残 的 全 日 工 或 轮班 工人 中 , 有 23% 是 从 

高 处 平台 落下 的 , 21% 是 从 脚手架 或 其 他 地 方 落下 

HJ, 19% 是 疲劳 过 度 , 20% 是 烧伤 或 资 伤 . 假定 

2 514 名 受伤 工人 作为 加 利 福 尼 亚 州 所 有 盖 房 受伤 

工人 总 体 中 的 一 个 随机 样本 . 
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a. 构造 摔 伤 工人 比率 的 95% 38 f IX [8]. 

b. 构造 烧伤 或 泛 伤 工人 比率 的 95% 置信 区 间 . 

102 住宅 修缮 工作 . 美国 商业 部 的 一 项 住宅 调查 
(AHS) 显 示 , 1 500 个 抽样 的 户主 中 有 705 个 户主 
在 他 们 房子 的 改建 或 修缮 中 是 “自己 动手 ”一 一 至 
少 有 一 次 由 他 们 自己 做 了 大 部 分 工作 ( Bureau of 
the Census, Statistical Brief, 1992 年 5 月 ). H 95% 
置信 区 间 估 计 在 家 庭 房屋 改建 或 修缮 中 自己 做 了 
大 部 分 工作 的 美国 户主 的 比率 . 并 解释 结果 . 


.103 KAA. 用 来 灌 装 啤酒 饶 的 机 器 应 该 使 


其 实际 分 配 灌 装 的 啤酒 量 的 变化 很 小 . 如 果 啤 酒 灌 
得 太 多 , 将 溢出 , 造成 浪费 . 如 果 啤 酒 灌 得 太 少 , BE 
中 没有 装 满足 够 的 啤酒 , 会 引起 消费 者 的 不 满 . 测 
得 随机 抽取 的 20 饶 啤酒 的 标准 差 是 0. 07 dx. 用 
9%5% 置 信 区 间 估 计 灌 装 量 的 真实 方差. 


. 104 岩石 中 的 流质 包 体 . 参考 练习 7.73LRM 光谱 


学 试验 . 在 随机 选择 的 4 天 中 , 每 天 测量 出 现在 两 
种 不 同 流质 包 体 ( 称 为 FREO 和 FRITZ) 中 液态 CO, 
含量 . 数据 见 下 表 . 用 区 间 估 计 比 较 两 种 流质 包 体 





的 CO, 浓度 (摩尔 分 数 ) 的 平均 差 . 
天 FREO 包 体 FRITZ 包 体 
86. 6 83.8 
2 84. 6 85.3 
3 85.5 84.6 
4 85.9 83.4 


资料 来 源 ; Wopenka, B. , 


to quantitative analysis of fluid inclusions in geological samples 


and Pasteris, J. D. “Limitations 


by laser Raman microprobe spectroscopy. ” Applied Spectrosco- 
py, Vol. 40, No. 2, Feb. 1986, p. 149. 


105 水 温 估 计 . 一 些 发 电厂 建 在 靠近 河 边 或 海边 
的 位 置 ， 以 便 有 充足 的 水 用 于 冷却 凝结 器 . 作为 环 
境 影响 研究 的 一 部 分 , 假定 发 电厂 想 估 计 工 厂 排 
出 的 水 和 离 岸 水 的 平均 水 温 之 差 . 以 9% 妈 置信 使 估 
计 两 个 均值 的 真实 差 在 0. 2% 之 内 , 需要 从 两 个 地 
方 抽取 多 少 个 样本 观测 值 ? 假定 每 个 地 方 的 读数 
极 差 约 为 4C , 且 每 个 地 方 都 取 相同 个 数 的 读数 ， 

106 HERE 医学 专家 认为 接触 棉花 苞 片 粉尘 
的 工人 易 得 呼吸 系统 疾病 . 他 们 做 了 一 个 试验 以 确 
定 风干 的 落 铃 棉 区 提取 物 (GBE) 对 没有 接触 棉 尘 的 
工厂 工人 细胞 的 影响 (Environmental Research, 1986 
年 2 月 ). 抽取 了 6 名 工人 的 血液 样本 , 用 不 同 浓度 
的 GBE 作用 于 这 些 血 液 , 经 一 段 短 时 间 后 , 测量 每 
个 血样 的 周期 AMP 水 平 (细胞 活力 以 每 百 万 细胞 皮 


N 


可 摩尔 度量 ). 下 表 给 出 两 种 GBE 浓度 ,0 mg/ml ( $5 
水 缓冲 剂 , 控制 溶液 ) 和 0. 2 mg/ml 的 数据 . (注意 ， 
对 取 自 每 个 工人 的 一 个 血样 本 作 等 份 试验 , 一 份 接 
触 盐水 缓冲 溶液 , 另 一 份 接触 CBE. ) 








工人 GBE 浓度 (mg/ml) 

0 0.2 

A 8.8 4.4 

B 13.0 5.7 

C 9.2 4.4 

D 6.5 4.1 

F 9.1 4.4 

H 17.0 7.9 
资料 来 源 : Butcher, B. T. , Reed, M. A. , and O' Neil, C. 
E. , "Biochemical and immunologic characterization of cotton 


bract extract and its effect on in vitro cyclic AMP production. " 


Environmental Research, Vol. 39, No. 1, Feb. 1986, 

p. 119. 

a. 求 接触 两 种 GBE 浓度 的 血液 样本 周期 AMP 水 
平 的 平均 差 的 95% 置信 区 间 . 


b. 由 a 得 到 的 区 间 能 说 明 接 触 CBE 限制 了 细胞 活 
力 吗 ? 


. 107 质量 保证 . 生产 次 品 的 费用 比 生产 正品 的 费 


用 大 (次 品 必须 废弃 或 重新 加 工 ). 这 个 简单 的 事 

实 提 示 工 人 们 应 该 通过 完善 生产 工序 来 保证 产品 

的 质量 , 而 不 是 依赖 对 完成 产品 的 检验 ( Deming, 

1986). 为 了 更 好 地 了 和 解 某 种 金属 压 模 工序 , 工厂 

主 希 望 估计 过 去 24 h 工序 所 生产 零件 的 平均 长 度 . 

a. 为 了 以 90% 置 信使 估计 总 体 均 值 在 0. 1 mm 以 
内 , 需要 抽取 多 少 个 零件 . 由 对 这 个 机 器 以 前 的 
经 验 知 , 压 膜 操作 的 产品 长 度 的 标准 差 大 约 
是 2 mm. 

b， 时 间 人 允许 样本 容量 不 能 超过 100, WE n= 
100 构造 的 90% 置信 区 间 , 那么 这 个 区 间 比 
用 a 确定 的 样本 容量 得 到 的 区 间 是 宽 还 是 窗 ? 
为 什么 ? 

c. 如 果 管 理 者 要 求 的 估计 在 0. 1 mm 以 内 ,所 用 
的 样本 容量 不 超过 100, 那么 一 个 符合 管理 者 要 
求 的 置信 区 间 可 能 达到 的 最 大 的 置信 水 平 近 似 
地 是 多 少 ? 

108 估计 岩石 密度 . 位 于 加 拿 大 圣 劳伦斯 河 下 游 

“七 岛 " 上 的 奇异 岩石 吸引 了 地 质 学 家 ， 进行 一 个 

多 世纪 的 研究 , 最 近 完 成 的 关于 “七 岛 " 的 -个 主 

要 研究 是 该 地 区 的 三 维 地 心 引力 模型 ( Canadina 

Journal of Earth Sciences, Vol. 27, 1990). 这 个 客观 


用 置信 区 间 售 计 
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模型 的 关键 之 一 是 得 到 岩石 密度 的 精确 估计 . 由 几 
个 不 同 岩 石 的 样本 , 得 到 的 岩石 密度 (g/cm ) 信息 
见 下 表 . 





岩石 类 型 ”样本 容量 ”平均 密度 标 WE 2 
晚期 辉 长 兰 36 3. 04 0. 13 
Boe en 148 2.83 0.11 


AK TRU 135 3. 05 0.31 
资料 来 源 : Loncarevic, B. D. , Feninger, T. , and Lefebvre, 
D. "The Sept- Iles layered mafic intrusion: Geo- physical ex- 
pression. " Canadian Journal of Earth Sciences , Vol. 27, 


Aug. 1990, p. 505. 


a. 用 90% Ha PC IB fe 8S Rb EEG SEIS RE. 
b. 解释 a 的 区 间 . 

7.109 田纳西 河 受 污染 的 鱼 . 参考 美国 陆军 工程 兵 
团 从 邻近 亚 拉 巴 马 化 工厂 的 田纳西 河 收 集 的 144 
条 污染 鱼 样本 数据 . 保存 在 DDT 文件 中 , 用 95% 
置信 区 间 估 计 污 染 的 鱼 是 海峡 鲍鱼 的 比率 ， 并 解 
释 所 得 结果 . 

7.110 SURE SEL. 做 一 项 试验 来 研究 在 长 期 连续 
摆动 后 碘 饱 和 溶液 的 测量 值 精度 . 表 中 给 出 了 同一 
溶液 的 n=10 个 碘 浓 度 测量 值 . 总 体 方差 ez 度量 
变异 性 , 即 测量 值 的 精度 . GP o^ 的 95% 置信 区 间 . 
并 解释 所 得 结果 . 





流 水 号 ko HT 
1 5. 507 
2 5.506 
3 5.500 
4 5.497 
5 5.506 
6 5.527 
7 5.504 
8 5.490 
9 5.500 
10 5.497 





7.111 使 用 MRP 的 制造 商 . 物资 需求 计划 (MRP) 
系统 是 产品 操作 的 计算 机 化 的 计划 和 控制 系统 . 自 
20 世纪 60 年 代 中 期 引进 以 来 , MRP 系统 用 来 管理 
原材料 和 在 制品 存货 清单 , 改善 顾客 服务 . 假定 你 
想 估计 使 用 MRP 系统 的 制造 商 比率 p. 以 0.95 的 
置信 系数 , 要求 估 计 p 在 0.02 以 内 , 大约 需要 多 
大 的 样本 ? (在 计算 中 利用 p=:0.5 的 保守 估计 . ) 

理论 练习 


7.112 设 y 表示 来 自 均值 为 A 的 泊 松 分 布 m 个 观 


测 值 的 随机 样本 均值 , y, 表示 来 自 均值 为 A, 的 泊 
MIH n 的 个 观测 值 的 随机 样本 均值 . 假定 样本 
是 独立 的 . 
a. 证明: Cy, -y ÆA -A 和) 的 无 偏 估计 . 
b. 3& V(y, -=- 郊 )、 如 何 估计 这 个 方差? 
c. 构造 (A -A,) 的 大 样本 (1 - a)100% 的 置信 区 
间 . (提示 : 用 
O -») -(A, -A,) 
n r 





作为 枢 轴 统计 量 . ) 
7.113 By,».».-. vy, 表示 概率 密度 为 
. 1 #80=y=<0+1 

fo) = lo 其 他 
均匀 分 布 的 随机 样本 . 

a. 证 明 ; 7 是 6 的 有 偏 估计 , 并 计算 这 个 估计 
的 偏 . 

b. R V). 

c. 7 的 什么 函数 是 0 的 无 偏 估计 ? 

7.114 假定 y 是 来 自 均值 为 0、 方 差 o 未 知 的 正 态 
分 布 的 容量 为 n=1 的 随机 样本 . 

a. 证 明 : y/o 服从 自由 度 为 1 的 卡 方 分 布 . ( 提 
示 : 由 定理 6. 11 直接 推出 的 结果 . ) 
b. 3 y/o? 作为 枢 轴 统计 量 , SR o7 的 %5% 置 信和 区间. 

7.115 假定 y 是 来 自 参 数 为 a=1, 任意 B 的 工分 布 
的 容量 为 n=1 的 随机 样本 . 

a 证 明 : 2y/B 服从 参数 为 a =1, B=2 的 工分 布 . 
(GR H 6.7 节 的 分 布 函数 方法 . ) 

b. 用 a 的 结果 证 明 : 2y/B 服从 自由 度 为 2 的 卡 方 
分 布 . (提示 : 由 5.7 节 直 接 推 出 的 结果 . ) 

c. 将 2y/B 作为 枢 轴 统计 量 , 求 8 的 95% 置 
信 区 间 . 

7.116 假定 y 是 来 自 均值 为 方差 为 1 的 正 态 分 
布 的 单个 观测 值 . 利用 y 求 4 的 95% 置信 区 间 . 
(提示 : 从 枢 轴 统计 量 (y — 8) 开始, 证 明 

P( 72995 Sy -U 25 gs ) = 0. 95 
再 应 用 例 7. 6 的 方法 . ) 

7.117 如 果 9 的 置信 区 间 中 点 的 期 望 等 于 0, MEK 
此 区 间 是 无 偏 的 . 

a. 证 明 : u 的 小 样本 置信 区 间 
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b. 证 明 ; o^ 的 置信 区 间 P(LCL«8«o«) «0.95. (提示 : 从 枢 轴 统计 量 y/0 
(n-l)s «2 (nDs 开始 , 证 明 (用 第 6 章 的 方法 )y/9 是 0 ~1 区间 上 
Xa X 的 均匀 分 布 . 然后 注意 到 
是 有 偏 的 . P[o < 2 <0.95)= "d = 0.95 
7.118 RE y 是 来 自 定义 在 0~6 区 间 上 均匀 分 ( < < ) J, M 


布 的 单个 观测 值 , oR e 099590 8H FEB LCL, 使 得 进一步 求 LCL. ) 


活动 中 的 统计 学 :PET 饮料 瓶 的 破裂 强度 

聚 对 茶 二 甲酸 乙 二 酯 (PET) 瓶 子 常用 来 装 碳酸 饮料 . 在 某 个 工厂 , 将 注射 模具 塑料 块 插 人 有 24 
和 孔 的 拉 吹 设备 , 就 可 以 生产 出 PET 瓶子 . 每 台 机 器 每 分 钟 可 生产 440 个 瓶子 . PET 瓶子 的 一 个 关键 性 
质 是 破裂 强度 一 一 在 加 压 下 装 满 水 的 瓶子 破裂 时 的 压力 . 

在 Journal of Data. Science(2003 年 5 月 ) 中 , 研究 者 测量 和 分 析 了 由 两 种 不 同 模具 设计 (新 设计 和 
旧 设 计 ) 生 产 的 PET 瓶子 的 破裂 强度 . 新 模具 设计 减少 了 吹 制 机 的 更 换 模 具 时 间 ,因此 减少 了 机 器 的 
停工 时 间 . 但 是 , 如 果 新 设计 生产 的 瓶子 具有 低 的 破裂 强度 , 这 个 优点 就 不 存在 了 . 所 以 有 必要 比较 
新 旧 模 具 设计 生产 的 瓶子 的 破裂 强度 . 

对 每 种 设计 , 在 32 天 期 间 , 每 天 每 个 孔 生产 的 瓶子 中 抽出 一 个 进行 检测 ， 得 到 分 析 数 据 , 由 于 
设备 有 24 个 孔 , 所 以 每 种 设计 有 32 x24 = 768 个 瓶子 . 给 每 个 瓶子 灌 满 水 并 加 压 ,， 直 到 它 破裂 ， 测 
得 这 时 的 压力 (lbyin”). 这 些 破裂 强度 保存 在 PETBOTTLE 文件 中 . 研究 者 证 实 了 瓶子 的 破裂 强度 ， 
在 时 间 ( 天 ) 上 没有 显著 的 趋势 , 也 没有 “和 孔 效应 ”( 即 在 每 项 设计 的 24 个 筷 之 间 没 有 显著 的 破裂 强 
度 差异 ). 因此 , 所 有 孔 及 所 有 天 的 数据 可 以 合并 来 比较 两 个 模具 设计 . 

首先 研究 者 比较 了 两 种 设计 的 平均 破裂 强度 , 差 (UNgw -JKorn) 的 95% 大 样本 置信 区 间 见 图 SIAT. 1 
的 SAS 输出 的 底部 . 得 到 的 区 间 ( -19.91，- 14. 16) 表 示 旧 模具 设计 的 平均 破裂 强度 超过 新 模具 设计 的 
平均 破裂 强度 , 差 是 在 14. 16 ~19.91 lb/in? 的 任意 地 方 . 依据 这 个 结果 ， 新 设计 比 不 上 旧 设 计 . 在 建议 
工厂 继续 使 用 旧 模 有 具 之 前 , 研究 者 又 比较 了 两 种 设计 的 破裂 强度 分 布 . 








Sample Statistics 


Group N Mean Std. Dev. Std. Error 
NEH . r68 199.3958 39.897 1.4396 
DLD 768 216.4323 7.5173 5.2713 


Hvpothesis Test 


Null hypothesis: Mean 1 - Mean 2 = 0 
filternat ive: Mean 1 - Mean 2 “= 0 
If Variances fire t statistic bf Pr >t 
Equal -11.629 1534 <.0001 
Not Equal -11.629 821.33 «.0001 


35X Confidence Interval for the Difference between Two Means 


Lower Limit Upper Limit 











SIA7.1 两 种 模具 设计 的 平均 破裂 强度 之 差 的 SAS 95% 置信 区 间 
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两 种 设计 的 破裂 强度 的 直方 图 见 图 STAT. 2 的 MINITAB 输出 . 注意 两 个 分 布 都 不 是 正 态 的 ， 这 个 事 
实 不 影响 上 面 由 大 样本 置信 区 间 所 作 的 推断 , 因 为 中 心 极限 定理 保证 样本 均值 之 差 (7New -7o1p ) 的 分 
布 是 近似 正 态 的 . 但 是 直方 图 给 出 了 新 设计 问题 本 质 的 某 些 解释 . 注意 到 图 SIA7.2 中 的 新 设计 是 双 峰 
分 布 . 新 模具 设计 显示 了 叫做 "早期 或 初期 失效 率 "的 现象 ， 即 新 设计 生产 的 某 些 瓶 子 在 不 正常 的 低压 
下 就 破裂 了 . 这 可 能 是 由 于 对 新 模具 的 不 熟悉 或 者 吹 拉 机 中 空气 流 对 新 模具 不 适应 造成 的 研究 者 也 注 
意 到 在 破裂 强度 分 布 的 上 端 , 新 设计 趋 于 比 旧 设 计较 大 的 破裂 强度 . 因此 , 他 们 建议 ,如果 早期 失效 率 
问题 能 够 解决 , 新 设计 实际 上 可 能 更 加 可 靠 ( 即 新 设计 生产 的 瓶子 的 平均 破裂 强度 大 ). 


Histogram of STRENGTH 
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STRENGTH 


Panel variable: DESIGN 
图 SIAT.2 两 种 模具 设计 的 破裂 强度 的 MINITAB 直方 图 
为 了 研究 这 个 现象 ， 研究 者 去 掉 了 数据 集合 中 所 有 破裂 强度 低 于 200 lb/in? 的 观 侧 值 后 重新 分 
析 数 据 . 结果 见 图 SIA7. 3 的 SAS 输出 . 差 (jwew -Horn ) ËJ 95% 置信 区 间 现 在 是 (5. 57, 6. 60). 所 以 


当 去 掉 早期 失效 数据 后 ， 新 模具 设计 的 平均 破裂 强度 超过 旧 设 计 的 平均 破裂 强度 为 5.57 ~ 
6. 60 Ib/in? 的 任意 一 点 . 





Sample Statistics 


Group N Mean Std. Dev. Std. Error 
NEH 555 223.1063 4.4783 0.1901 
oLD 758 217.0172 4.865 0.1767 


Hypothesis Test 


Null hypothesis: Mean 1 - Mean 2 = 0 
ñlternative: Mean 1 - Mean 2 ^= 0 
If Variances fre t statistic Df Pr >t 
Equal 23.163 1311 <.0001 
Not Equal 23.451 1244.8 <.0001 


985X Confidence Interval for the Difference between Two Means 


Lower Limit Upper Limit 











图 SIA7.3 ”两 种 模具 设计 的 平均 破裂 强度 之 差 的 SAS 95% 置信 区 间 : 去 掉 早期 失效 数据 后 
这 个 分 析 促 使 工厂 的 领导 者 解决 新 模具 的 早期 失效 问题 . 


第 8 章 假设 检验 


目标 “介绍 假设 统计 检验 的 基本 概念 和 一 些 常见 的 总 体 参 数 的 统计 检验 方法 ,并 举例 说 明 它 们 
在 实际 抽样 中 的 应 用 . 


8.1 假设 统计 检验 与 置信 区 间 的 关系 


正如 第 7 章 所 介绍 的 , 对 于 总 体 参数 的 推断 一 般 有 两 种 方法 . 可 以 利用 置信 区 间 ( 第 7 章 的 内 
容 ) 来 估计 它们 的 值 或 者 可 以 作出 总 体 参 数 指定 值 的 决策 (检验 关于 这 些 值 的 假设 )， 即 本 章 议题 . 

置信 区 间 和 假设 检验 是 有 联系 的 , 并 可 用 于 对 参数 的 决策 . 例如 , 假设 美国 环保 署 (EPA ) 的 调 
查 人 员 想 判断 化 工厂 排放 某 种 污染 物 的 平均 水 平凡 是 否 符合 美国 环保 署 的 标准 . 如 果 美 国 环保 署 允 
许 的 浓度 上 限 是 百 万 分 之 三 , 那么 调查 人 员 通 过 抽样 数据 (日 污染 检测 值 ) 便 可 以 判断 这 家 公司 是 否 
违反 了 法 律 , 也 就 是 判断 是 否 j >3. 如 果 风 的 99% 置信 区 间 只 包含 大 于 3 的 数据 , 那么 美国 环保 署 
就 可 以 认为 此 污染 物 排放 的 平均 水 平 超过 了 所 设 的 界限 . 

第 二 个 例子 , 某 厂商 购买 一 批 10 000 个 电灯 保险 丝 , 假设 供 货 商 保证 在 任何 特定 批 中 不 合格 品 
不 超过 1%. 当然 , 厂商 不 能 检查 这 一 批 10 000 个 保险 丝 中 的 每 一 个 , 所 以 必须 从 这 批 中 选取 一 个 保 
险 丝 样本 进行 检验 , 根据 检验 结果 决定 是 接收 还 是 拒绝 这 批 . 比方 说 n=100 的 样本 中 , 不 合格 品 个 
数 了 比较 大 , 那么 厂商 将 拒绝 这 批 并 退回 给 供 货 商 . 因此 厂商 是 通过 样本 所 包含 的 信息 来 判断 这 批 
中 不 合格 品 率 p 是 否 超过 0.01. 如 果 疡 的 置信 区 间 在 0.01 的 左 侧 , 那么 该 厂商 便 接受 这 批 货 , 并 且 
相信 不 合格 品 率 低 于 1% , 反之 , 则 拒绝 . 

上 述 两 个 例子 说 明 置 信 区 间 如 何 用 于 对 参数 进行 决策 . 我 们 注意 到 这 两 个 应 用 都 是 单 侧 的 ， 即 
美国 环保 署 想 判断 是 否 人 >3,， 厂商 想 知 道 是 否 p >0.01. (RAK, 如果 厂 商 感 兴趣 的 是 判断 是 否 
p 20.01 或 p <0.01, 那么 这 种 推断 就 是 双 侧 的 . ) 

回顾 第 7 章 , 为 了 求 用 于 (1 -a)100% 置信 区 间 中 的 z( 或 已 值 , 将 a 的 值 平分 , 在 Z( 或 7) 分 布 
的 上 尾 和 下 尾部 分 都 放置 2/2. 如 此 , 置信 区 间 就 成 为 双 侧 的 . 当 实 际 情况 应 该 用 单 侧 方 法 而 误 用 双 
侧 方法 时 , 会 使 研究 者 (例如 , 美国 环保 署 或 者 厂商 ) 克制 地 陈述 与 此 方法 关联 的 置信 水 平 . 正如 这 
一 章 中 将 介绍 的 假设 检验 既 适 合 于 单 侧 , 也 适合 于 双 侧 总 体 参数 决策 . 


8.2 统计 检验 的 要 素 与 性 质 


回 到 美国 环保 署 的 例子 来 介绍 假设 检验 的 有 关 概 念 . 我 们 将 采用 一 种 类 似 于 反 证 法 的 方法 . 美 
国 环保 署 想 支持 的 理论 , 称 为 备 择 (或 者 研究 ) 假 设 , 即 人 >3, 其 中 表示 污染 的 真实 平均 水 平 ( 百 
万 分 之 一 ) , 备 择 假设 记 为 及. 否认 备 择 假设 的 理论 , 即 至 多 等 于 3, nu -3, 称 为 原 假设 , 记 为 
Ho. 这 样 ， 美国 环保 署 希望 能 通过 得 到 的 样本 证 据 指出 原 假设 六 = 3 是 不 真实 的 , 以 证 明 对 备 择 假设 
123 的 支持 . 即 美国 环保 署 希 望 检 验 








Ho: H =3 
H,: H >3 . 
是 否 拒绝 原 假设 的 决策 依赖 于 一 个 由 样本 数据 算得 的 统计 量 , 称 作 检验 统计 量 . 例如 ,假定 美 


假设 检验 267 





国 环保 各 计 划 将 它 的 决策 基点 放 在 n=30 个 日 污染 读数 . 若 30 个 污染 测量 值 的 样本 均值 了 比 3 大 得 
多 , 那么 美国 环保 署 趋 于 拒绝 原 假设 , 得 出 人 >3 的 结论 . 然而 如 果 了 小 于 3, 比如 了 =2.8( 百 万 分 之 
一 ) ,只 有 不 充分 的 证 据 拒绝 原 假设 . 因此 样本 均值 了 作为 一 个 检验 统计 量 . 

检验 统计 量 7 的 值 可 以 分 为 两 个 集合 . 大 于 某 个 特定 值 的 部 分 (如 7z3. 1) 将 意味 着 拒绝 原 假 
设 , 且 接 受 备 择 假设 . 检验 统计 量 值 的 这 个 集合 称 为 检验 的 拒绝 域 . 原 假设 而 :人 =3, 对 备 择 假设 : 
H,:u»3 的 检验 ,利用 样本 均值 了 作为 检验 统计 量 ， 上 且 7 了 >3. 1 作为 拒绝 域 , 描述 了 一 个 具有 特定 性 
质 的 特殊 检验 . 如 果 把 拒绝 域 改 为 ?>=3.2, 便 会 得 到 具有 不 同性 质 的 另 一 检验 . 

前 面 的 讨论 表明 一 个 统计 检验 包括 5 个 要 素 , 总 结 在 下 面 的 框 格 中 . 





统计 检验 的 要 素 
. RRE 甩 一 一 关于 一 个 或 多 个 总 体 参 数 . 
. 备 择 假设 及, 一 一 如 果 我 们 决定 拒绝 原 假设 则 将 接受 的 假设 . 
.检验 统计 量 一 一 由 样本 数据 计算 的 . 
.拒绝 域 一 一 使 得 原 假设 被 拒绝 的 检验 统计 量 的 取 值 . 
.结论 一 一 作出 接受 还 是 拒绝 原 假设 的 决策 . 
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由 于 统计 检验 只 能 是 两 种 结果 中 的 一 个 表 8. 1 美国 环保 署 假设 检验 的 结论 与 后 果 





(拒绝 或 不 拒绝 原 假设 ) 检 验 的 结论 容易 犯 两 种 实际 情况 
类 型 的 错误 . 在 前 面 的 例子 中 , 美国 环保 署 想 检 公司 未 违反 标准 公司 违反 标准 
W Hy: 73 对 H.: p>3. 如 果 美国 环保 署 的 调 EPA 的 决策 (H, 为 真 ) (H, 为 真 ) 
查 人 员 得 出 的 结论 是 H, 为 真 ( 即 拒绝 Ho), 那 公司 违反 标准 (拒绝 H) I 型 错误 正确 决策 


么 美国 环保 署 将 控告 该 公司 违反 了 污染 物 排放 公司 未 违反 标准 (接受 后 ) 
标准 . 美国 环保 署 可 能 犯 的 两 种 类 型 错误 . 如 
表 8.1 所 示 . 

美国 环保 署 可 能 拒绝 原 假设 , 然而 如 果实 际 上 原 假设 为 真 . 换 句 话说 , 美国 环保 里 可 能 以 违反 
排放 物 标准 为 由 控告 该 公司 , 而 实际 上 该 公司 没有 违反 标准 ( I 型 错误 ). 或 者 美国 环保 署 可 能 决定 
接受 原 假设 , 而 实际 上 原 假设 为 假 . 换 名 话说 , 美国 环保 署 可 能 认为 该 公司 没有 违反 污染 物 排放 标 
准 , 而 实际 上 该 公司 却 违 反 了 标准 ( 工 型 错误 ), 当 我 们 进行 假设 检验 时 犯 这 两 类 错误 的 概率 度量 了 
作出 错误 结论 的 风险 , 从 而 也 提供 了 这 种 推断 作出 决策 过 程 优良 性 的 度量 . 

定义 8.1 拒绝 为 真 的 原 假设 是 I 型 错 误 . Jo 1 型 错误 的 概率 用 符号 w Ë £. 

定义 8.2 接受 为 假 的 原 假设 是 卫 型 错误 . Jer 型 错误 的 概率 用 符号 局 表 示 . 

在 工 型 和 型 两 类 错误 中 , 哪个 更 严重 ? 从 美国 环保 署 的 角度 来 讲 ，I 型 错误 是 更 严重 的 错误 . 
因为 如 果 美国 环保 署 错误 地 控告 该 公司 违反 污染 物 排放 标准 , 那么 可 能 有 一 场 高 额 成 本 的 诉讼 . 另 
一 方面 , 生活 在 化 工厂 附近 的 居民 认为 卫 型 错误 后 果 更 为 严重 , 因为 如 果 出 现 这 种 错误 , 美国 环保 
各 没有 控诉 该 公司 , 而 实际 上 污染 了 周围 空气 . 无 论 哪 种 情况 , 计算 概率 a Me, 评估 假设 检验 导出 
的 推断 可 靠 性 是 重要 的 . 下面 的 4 个 例子 将 说 明 如 何 计算 这 些 概率 . 

某 笔 记 本 电脑 生产 商 认为 , 20% 以 上 的 电脑 购买 者 可 能 购买 某 种 软件 包 . 随机 选取 10 名 
电脑 的 预期 购买 者 ， 询 问 他 们 是 否 对 此 软件 包 感 兴趣 . 他 们 之 中 有 4 人 表示 打算 购买 此 软件 包 . 这 个 
样本 能 提供 充分 的 证 据 来 证 明 多 于 20% 的 电脑 购买 者 会 购买 此 软件 包 吗 ? 


正确 决策 了 型 错误 


立 _ 
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解 令 p 表 示 所 有 电脑 预期 购买 者 中 会 购买 此 软件 包 的 真实 比率 . 既然 我 们 想 证 明 p >0.2, 3E 
么 就 选择 H.: p >0.2 作为 备 择 假设 , Ho: p =0. 2 作为 原 假设 . 用 二 项 随机 变量 了 样本 中 打算 购 
买 此 软件 包 的 人 数 , 作为 检验 统计 量 , 如 果 了 较 大 的 话 , 就 可 以 拒绝 Ho: p=0.2. 图 8.1 是 n=10， 
p =0.2 时 p(y) 图 . 
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图 8.1 n=10, p=0.2 时 p(y) 图 ， 即 如 果 原 假设 为 真 的 情形 
Y 的 大 值 支持 备 择 假设 HL, p >0.2, 可 是 在 拒绝 域 中 应 该 包含 哪些 Y 值 呢 ? 假如 取 Y=4 的 值 作 
为 拒绝 域 , 那么 检验 的 要 素 如 下 : 
Hy: p=0.2 
H.: p >0.2 
检验 统计 量 ; Y=y 
拒绝 域 : yzm4 
在 这 个 检验 中 , 我 们 发 现 了 的 观测 值 y =4 落 入 拒绝 域 中 . 因此 根据 这 种 检验 方法 , 可 以 拒绝 厦 
假设 Ho: p=0.2, 并 推断 生产 商 的 观点 是 正确 的 ， El p >0. 2. 
如 果实 际 上 原 假设 为 真 , 例题 8. 1 的 统计 检验 方法 导致 我 们 得 出 一 个 错误 决策 的 概率 是 
多 少 ? 
解 计算 检验 方法 导致 犯 [型 错误 , BD H, 实际 为 真 却 拒绝 了 Ha 的 概率 o, 这 是 y 落 入 拒绝 域 
而 实际 上 p 20.2 的 概率 : 


a = P(Y>4|p=0.2)=1- 220) 
对 于 n=10, p=0.2 的 二 项 随机 变量 部 分 和 È p(y) HE B. 2 HA 0.879, 因此 ， 


a=1- X p(y) = 1 -0.879 = 0.121 
当 实际 上 Ho 为 真 ， 而 统计 方法 却 得 到 结论 p >0. 2 的 概率 是 0. 121. 这 个 概率 对 应 于 图 8. 1 中 阴影 区 
域 的 面积 . 
在 例 8.2 中 , 我 们 计算 了 犯 I 型 错误 的 概率 o. 犯 卫 型 错误 ， 即 没 能 发 现 p 值 大 于 0.2 的 概率 B 
依赖 于 p 的 取 值 . 例如 , # p 20.200 01, 我 们 便 很 难 发 现 它 与 原 假设 p =0.2 之 间 这 细小 的 偏离 相 
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E, 若 pP =1.0, 表明 微机 的 每 一 个 预期 购买 者 都 想 购买 此 软件 包 , 在 这 种 情况 下 ,从 样本 的 信息 非 
常 显然 得 到 p » 0. 2. 将 在 例 8. 3 中 说 明 B 的 计算 方法 . 

参考 例 8. 2, 假设 p =0.60. 那么 实际 上 p =0. 60, 检验 方法 没 能 拒绝 已:p 20.2 的 概率 有 
是 多 少 ? 

解 图 8.2 给 出 了 参数 n= 10, pO) 
p =0. 6 的 二 项 概率 分 布 p(y). 没 能 拒绝 0.3 上 
H 的 概率 等 于 了 =0, 1, 2 或 者 3 的 概 
AR, 也 就 是 了 的 值 没 有 落 人 拒绝 域 的 概 
率 . 这 个 概率 B 对 应 于 图 中 概率 直方 图 的 
阴影 部 分 面积 . 所 以 对 n=10 fü p 20.6, 
B= P(Y<3|p = 0.6) 


= 2, 00) 

根据 表 B.2, n =10, p =0.6 的 二 项 
随机 变量 部 分 和 为 0.055. 因此 , 当 p 真 ”图 8.2 n=10, p=0.6 时 p(y) 图 , 即 备 择 假设 为 真 的 情形 
实 值 为 0.6, 而 我 们 却 没 有 拒绝 Ho: p 20.2 的 概率 是 6 =0. 055. 

统计 检验 另 一 个 重要 的 性 质 是 发 现 与 原 假设 偏离 的 能 力 ， 如 果 这 种 偏离 是 存在 的 . 这 种 能 力 用 
实际 上 Ho 非 真 时 拒绝 H, 的 概率 来 度量 , 注意 , 这 个 概率 简单 地 就 是 (1 — 8): 

P( Ho 非 真 时 拒绝 Ho) =1 - P( H; EEIZ H) =1-P( 卫 型 错误 ) =1 — B 

概率 (1 -B) 称 作 检验 的 功效 . 当 这 种 偏离 存在 时 , 功效 越 强 , 发 现 与 H, 偏离 的 概率 值 就 越 大 . 

定义 8.3 统计 检验 的 功效 (1 -B) 是 实际 上 H, 为 非 真 时 拒绝 原 假设 H, 的 概率 . 
参考 例 8. 1 中 的 假设 检验 , 求 p 20.3 时 的 检验 功效 . 

解 由 定义 8.3 可 知 , 检验 功效 等 于 概率 (1 -B). 当 p 的 真 值 为 0.3 时 , 我 们 没 能 拒绝 H: p = 
0.2 的 概率 , 也 就 是 犯 卫 型 错误 的 概率 将 比例 8.3 中 计算 的 B 值 大 . 因为 p =0.3 比较 接近 原 假设 p = 
0.2. 所 以 对 n=10 和 p=0.3， 


B=P(Y<3|p =0.3) = 2 p(y) 


根据 表 B. 2, 可 以 查 到 n=10, p 20.6 的 二 项 随机 变量 部 分 和 的 值 为 0. 650. 因此 , 实际 上 p 20.3, R 
们 没 能 拒绝 Ho: p =0.2 的 概率 B =0. 650， 而 检验 功效 是 (1 -B) = (1 -0.650) =0.350. 由 此 可 以 看 
出 , p 的 实际 值 越 接近 原 假设 的 值 ， 就 越 不 可 能 拒绝 Ho: p =0.2. 

前 面 的 例子 说 明 对 于 一 个 简单 的 统计 检验 我 们 如 何 计算 a 和 B, 从 而 度量 犯 [型 错误 和 开 型 错 
误 的 风险 . 这 两 个 概率 描述 了 这 种 推断 方法 的 性 质 , 使 我 们 可 以 由 此 比较 不 同 的 检验 方法 . 例如 有 两 
个 检验 , 每 个 检验 拒绝 域 的 选取 都 是 使 a 等 于 某 个 特定 值 (如 a =0.1). 对 于 指定 的 备 择 假设 , 将 选 
择 犯 工 型 错误 风险 较 小 的 那个 检验 , 也 就 是 B 值 小 的 那个 检验 . 这 等 价 于 选择 较 高 功效 的 检验 . 

在 下 面 几 节 中 , 我 们 将 介绍 许多 统计 检验 . 在 每 一 种 情况 下 犯 1 型 错误 的 概率 a 都 是 已 知 的 ， 
El o, 是 由 试验 者 选取 的 且 拒 绝 域 是 相应 地 确定 的 . 相反 , 对 于 某 个 备 择 假设 的 B 通常 很 难 计算 . 这 就 
是 为 什么 我 们 总 是 努力 由 数据 不 支持 H) 来 证 明 H, 为 真 . 我 们 希望 用 样本 作为 证 据 来 支持 备 择 (或 
研究 ) 假设. 如 果 是 这 种 情况 的 话 , 我 们 就 只 关心 犯 工 型 错误 , 也 就 是 弃 真 错误 , 然而 犯 弃 真 错误 的 
概率 a 是 已 知 的 . 
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应 用 练习 中 随机 选择 20 个 变量 , 记录 其 中 数组 变量 的 个 数 


8. 
8. 


œ 


1 杂记 . 对 假设 的 统计 检验 定义 a # p. 

2 杂记 . 解释 下 列 每 一 个 陈述 为 什么 是 错误 的 : 

a 原 假设 正确 的 概率 等 于 a. 

b， 如 果 原 假设 被 拒绝 ， 那么 检验 证 明 备 择 假设 是 
正确 的 . 

c. 假设 的 所 有 统计 检验 中 , a +B =1. 


.3 筛选 新 药 . 制药 公司 总 是 不 断 研究 新 药 . 为 了 


少数 可 能 有 效 的 化 合 物 要 试验 数 千 种 化 合 物 , 在 
制药 行业 称 之 为 “药物 筛选 -Dunnett( 1978 ) 认为 
药物 筛选 法 在 统计 决策 问题 方面 还 处 于 初级 阶 
Ei. 在 药物 筛选 中 , 可 能 会 有 两 种 行动 : (1) E 
绝 ' 这 种 药物 , 即 试验 的 药 几乎 没有 疗效 , 这 种 情 
况 下 放弃 该 药物 ， 镁 选 另 一 种 药物 ; (2) 暂 时 ' 接 
受 ' 这 种 药物 , 这 种 情况 下 进行 进一步 更 加 精细 
的 试验 2 由 于 研究 者 的 目标 是 找到 -种 具有 疗效 
的 新 药 , 所 以 统计 检验 的 原 假设 和 备 择 假 设 应 取 
如 下 形式 : 

Hy: 对 某 种 疾病 药物 没有 疗效 

H,: 对 某 种 疾病 药物 具有 疗效 
Dunnett 解释 与 药物 筛选 过 程 关联 的 可 能 错误 , “一 
种 药物 实际 上 具有 疗效 却 被 放弃 ( 假 阴 性 ) 这 显然 
是 令 人 不 快 的 事情 , 其 中 总 存在 某 些 风 险 . 另 一 方 
面 , 对 一 种 实际 上 没有 疗效 的 药物 却 继续 进行 高 
成 本 的 试验 ( 假 阳 性 ) 浪 费 了 时 间 和 金钱, 这些 时 
间 和 金钱 本 可 以 去 试验 其 他 化 合 物 . ” 
a. 假 阴性 对 应 于 哪 一 类 型 错误 ，I 型 还 是 也 型 ? 
b. 假 阳 性 对 应 于 哪 一 类 型 错误 ，I ARE E? 
c. 两 种 类 型 错误 哪 一 类 更 严重 ? 解释 原因 . 


.4 Pascal 数组 变量 . Pascal 是 一 种 常用 于 微 处 理 机 


的 高 级 编程 语言 . 我 们 做 一 个 试验 来 研究 Pascal 变 
量 中 数组 变量 ( 与 其 对 应 的 是 标量 变量 , 标量 变量 
执行 时 间 较 费时 ) 所 占 的 比率 . 从 一 段 Pascal 程序 


8.3 求 检验 统计 量 : 经 典 方法 
对 总 体 的 一 个 或 多 个 参数 进行 统计 检验 , 必须 ， (1) 找 到 一 个 合适 的 检验 统计 量 ; (2) 确定 拒绝 


R. 经 典 统计 学 家 通常 采用 由 费 希 尔 
验 . 例如 , 我 们 想 检 验 关于 概率 函数 


œ 


Y. 假如 我 们 想 检 验 Pascal 是 一 种 比 20% 变量 是 数 
组 变量 的 Algol 更 有 效 的 语言 . 换 旬 话说 , 我 们 要 
检验 Ho: p=0.20, H,: p >0.20, 其 中 p 表示 每 次 
试验 中 观测 到 数组 变量 的 概率 . (假设 20 次 试验 是 
独立 的 . ) 

a， 求 拒绝 域 了 >8 H at. 

b. 求 拒绝 域 Y>5 的 a fE. 

c. 求 拒绝 域 Y>8 的 B 值 , WR p -0.50. (i$; 过 
去 的 经 验 表明 在 大 多 数 Pascal 程序 中 数组 变量 
约 占 一 半 . ) 

d. 求 拒绝 域 Y>5 的 8 值 , 如 果 p=0. 50. 

e. 对 于 拒绝 域 Y>8 sk Y25, 如 果 想 极 小 化 犯 I 型 
错误 的 概率 , 应 选 哪 一 个 ? 若 想 极 小 化 犯 工 型 
错误 的 概率 又 应 如 何 选 ? 

£ 求 形 如 Y>a 拒绝 域 , 使 得 a 近似 等 于 0. 01. 

g. EFKE p = 0.4, 求 f 中 确定 的 拒绝 域 检验 
功效 . 

h. 若 事 实 上 p 20.7, 求 f 中 确定 的 拒绝 域 检验 
功效 . 


“5 失效 的 功率 表 . 某 厂 生产 调节 数据 交换 系统 


能 阀 用 的 功率 表 , 厂商 声称 如 果 生 产 过 程 正确 
操作 的 话 , 只 有 10% 的 功率 表 是 不 合格 品 . — 3 
主 刚 收 到 厂商 发 送 的 一 批 货 , 共 25 块 功率 表 
假定 该 买主 想 检 验 Hosp 20.10 X$ H: p > 
0.10, 其 中 p 表示 功率 表 是 不 合格 品 的 真实 比 
率 . 用 Y>6 作为 拒绝 域 . 

a. 对 于 这 种 检验 方法 确定 a 的 值 . 

b. EFKE p -0.2, 求 B 值 以 及 检验 功效 . 

e. 若 事实 上 P=0.4, 求 8 值 以 及 检验 功效 . 


理论 练习 


8. 


6 EH: 对 于 固定 的 样本 容量 n, a 随 着 B 的 增 大 
而 减 小 , 反之 亦 然 . 


(R. A. Fisher) 提 出 的 方法 来 寻找 合理 的 检验 统计 量 进行 假设 检 
P(7) 或 密度 函数 fy) 的 唯一 参数 的 假设 . 2 表示 样本 的 似 然 


RZ. 那么 为 了 检验 原 假设 Ho: 9 = 60， 费 希 尔 的 似 然 比 检验 统计 量 是 : 





et al. 


Q 摘自 Tanur, J. M., 


, eds. Statistics: AGuide to the Unkown. San Francisco; Holden- Day, 1978. 
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y -假定 2= bo 时 的 似 然 函 数 _ L(00) 
假定 9= 0 RERA LC) 
其 中 0 表示 0 的 极 大 似 然 估 计 . 费 希 尔 分 析 指出 , 2 9 与 g 不 同 , 则 当 0 = ó 时 似 然 工 大 于 9=6o 的 
L. 因此 检验 的 拒绝 域 由 较 小 的 和 值 构成 , 如 小 于 某 一 Aa 的 值 . 
如 果 有 兴趣 想 多 学 一 点 费 希 尔 的 似 然 比 检验 , 可 以 参考 本 章 最 后 的 参考 文献 . 所 幸 的 是 , 我 们 直观 选取 
的 检验 统计 量 多 数 都 是 相应 的 似 然 比 统计 量 A 的 函数 , 它们 也 是 第 7 章 用 于 构造 置信 区 间 的 枢 轴 统计 量 . 
回顾 第 7 章 的 大 多 数 枢 轴 统 计量 , 对 于 大 样本 有 近似 正 态 的 抽样 分 布 . 根据 这 一 性 质 , 不 难得 出 
假设 的 大 样本 统计 检验 . 为 了 说 明 , 假如 想 检验 参数 9 的 假设 H.: 9 = 0,, 0 的 估计 量 和 服从 均值 为 
0, 标准 差 为 oo 的 正 态 抽 样 分 布 . 进一步 假定 o STEEL ADU, 或 者 当 样 本 容量 较 大 时 可 以 得 到 8 的 好 
的 近似 . 可 以 证 明 (证 明 过 程 略 ) 似 然 比 检验 统计 量 A 可 简化 为 标准 正 态 随机 变量 Z. 
8 - 8 
Z=— 
08 
这 个 检验 拒绝 域 的 位 置 可 以 由 检查 检验 统计 量 Z 的 形式 来 推出 .6 与 b 的 偏离 越 大 ， 即 一 者 离 
差 的 绝对 值 越 大 , 越 有 充足 的 证 据 表明 9 不 等 于 6o. 如 果 想 发 现 6 的 值 大 于 0o, MH: 0 » 69, 拒绝 
域 应 位 于 标准 正 态 z 检验 统计 量 的 抽样 分 布 的 上 尾 ( 见 图 8. 3a). 如 果 想 发 现 0 的 值 小 于 6). BI H.; 
0 « 6o, 拒绝 域 应 位 于 z 分 布 的 下 尾 ( 见 图 8. 3b). 由 于 整个 拒绝 域 仅 在 z 分 布 的 一 侧 , 因此 这 两 种 检 
验 称 作 单 侧 统计 检验 . 然而 如 果 想 发 现 9 的 值 大 于 6 或 者 小 于 05, 即 H,: 0960, , 拒绝 域 应 该 分 别 位 
于 z 分 布 的 上 尾 和 下 尾 处 ( 见 图 8.3c). 这 种 检验 称 作 双 侧 统计 检验 . 


























fa) f) f 
a a & 
“N N 2 Ü z 
| 拒绝 域 - -拒绝 域 -| -拒绝 域 -| EZTA 
a) fusus “ ^ 间 双 侧 检验 C^ ogg 2 
H4:0 > 0g Hx 6 < o H,: 0 > 0o 


图 8.3 单 侧 和 双 侧 检验 的 拒绝 域 


将 前 面 介绍 的 大 样本 统计 检验 总 结 在 下 面 . 本 章 其 余 小 节 所 讨论 的 许多 总 体 参 数 和 检验 统计 量 
都 满足 这 种 检验 方法 的 假定 . 将 用 总 体 均值 人 的 实际 例子 讲述 检验 的 用 法 . 





基于 标准 正 态 Z 检验 统计 量 的 大 样本 检验 

单 侧 检验 双 侧 检验 
Hy: 6-6, Hy: 0 - 6, 
H,: 020,4. H,: 0 <6,) H,: 0#0, 
检验 统计 量 ; Z=- 检验 统计 量 : Z=- 

os 9$ 
EER: Z >z,( 或 者 Z < -z ) EAA: |Z| >z 
HP P(Z>z,) =a H P(Z >z.) =a/2 
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高 速 公路 路 政 署 负责 维修 一 段 25 mile 长 的 州 际 公路 , 希望 设计 一 种 结构 上 有 效 的 路 
面 . 一 个 重要 的 考虑 因素 是 这 条 州 际 公路 负担 的 重型 货运 量 . 州 称 重 站 报告 , 这 条 州 际 公 路 的 
25 mile 段 平均 每 小 时 通过 72 辆 重型 卡车 . 然而 这 条 公路 有 一 段位 于 市 区 , 而 且 路 政 署 的 工程 师 
认为 这 一 段 公 路 的 重型 货运 量 比 整个 州 际 公路 的 平均 值 要 大 . 为 了 证 实 这 一 观点 , 路 政 署 检测 了 
在 整个 月 中 随机 挑选 的 50 个 1 h 内 通过 的 重型 卡车 数量 . 假设 50 个 抽样 小 时 的 重型 货运 量 样本 
的 均值 和 标准 差 为 ， 
y=74.1 _s=13.3 

数据 是 否 支 持 路 政 署 的 观点 ? 用 a =0. 10. 

E 在 这 个 例子 中 , 我 们 所 关心 的 参数 是 ww， 即 25 mile 的 州 际 公路 上 平均 重型 拖车 通过 量 . 对 
于 较 大 的 样本 容量 n, 样本 均值 7 用 来 估计 参数 w, 并 且 了 有 近似 正 态 抽样 分 布 . 由 此 , 我 们 可 以 应 用 
上 面 介绍 的 大 样本 检验 . 








Ho: 272. 
H : p>72. 
-72 7-72 了 -72 
y Bw £ i 量 : Z=% = ~ 
检验 统计 量 T; Mu va 
拒绝 域 . Z>1.28 (由 表 B.5, zo jo = 1.28) 
将 样本 统计 量 代 人 检验 统计 量 得 ， 
74. 1 -72 fi) 
7= 一 一 一 -二 =1.12 
13.3/ v50 


虽然 样本 中 平均 每 小 时 重型 货运 卡车 通过 量 比 州 
平均 量 多 2 辆 , 但 是 2 等 于 1. 12 并 没有 落 在 拒绝 域内 
( 见 图 8. 4). 因此 , 这 个 样本 在 a =0.10 情况 下 , 并 不 





能 提供 充分 的 证 据 支持 路 政 署 的 观点 . æ - 00 
TE 8.5 中 , 做 出 错误 决策 的 风险 是 多 少 ? 如 — . 

果 拒 绝 了 原 假设 , 那么 知道 犯 I 型 错误 ( 弃 真 ) 的 — 

概率 是 w 20.10. 但 是 , 没 能 拒绝 例 8.5 中 的 原 假 


设 , 我 们 必须 关心 犯 工 型 错误 ( 纳 伪 ) 的 概率 . 将 在 
例 8. 6 中 计算 犯 了 型 错误 的 风险 . 图 8.4 例 8.5 中 检验 统计 量 的 位 置 
参考 例 8. 5 关于 的 单 侧 检验 . 如 果 州 际 公路 这 段 25 mile 上 重型 货运 卡车 的 平均 数 u X 
际 上 是 每 小 时 78, 那么 例 8. 5 中 检验 方法 不 能 发 现 真 实情 况 的 概率 是 多 少 ? 换 句 话说 ， 当 WAH 
等 于 78 时 , 这 个 单 侧 检 验 中 没 能 拒绝 Ho: - 72 的 概率 6 是 多 少 ? 
AR 为 了 计算 大 样本 了 检验 的 B 值 ， 需 要 通过 点 估计 量 6 来 指定 拒绝 域 ， 本 例 中 , 9 = 了 由 图 
8.4 可见, 拒绝 域 由 >1. 28 的 值 构成 . 为 了 确定 对 应 于 z = 1.28 的 了 值 , RAFE 
Yy-Ho Y-Ho y-72 
Z=——= 或 1.28 = — 4 
o/ n vs 13. 3/ /50 
求解 了, SR y 274.41. 所 以 检验 的 拒绝 域 是 Z>1.28 BUB SETTE yz 74. 41. 
图 8.5 中 的 虚 曲 线 是 Ho: - 72 为 真 时 了 的 抽样 分 布 . 这 条 曲线 用 于 确定 Y( 或 等 价 的 z 值 ) 的 折 
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绝 域 , B5 Ho: z =72 FERYE. 实 曲线 是 =78 时 了 的 抽样 分 布 . 因为 想 知道 当 Hy 实际 上 非 真 且 
人 =78 BJ B 的 值 , 也 就 是 求 &=78 时 7 了 没有 落 在 拒绝 域内 的 概率 . 这 个 概率 对 应 于 实 曲线 下 方 了 < 
74. 41 的 阴影 区 域 面积 . 为 了 计算 正 态 曲线 下 这 个 阴影 区 域 的 面积 , 需要 求 相应 于 
_y-78 74.41-78 _ 
| o/ín 13.3//50 - 
的 面积 A. Hide B. 5 可 以 查 得 A 等 于 0.4719. 由 图 8.5 可 见 
B=0.5-A=0.5—-0.4719 =0. 0281 
PRG, 5 u 的 真 值 实际 上 为 =78 时 , 我 们 没 能 拒绝 Ho: u 72 的 概率 仅 为 0. 0281. 

例 8. 6 表明 , 对 大 样本 Z 检验 ( 见 框 格 ) 的 不 同 备 择 假设 , 6 的 计算 并 不 十 分 困难 . 但 是 对 于 其 他 
检验 , B 的 计算 可 能 非常 困难 . 虽然 当 的 精确 值 无 法 获得 或 者 难于 计算 时 ,可 以 采用 一些 复杂 的 方 
法 来 评价 犯 卫 型 错误 的 风险 , 但 是 这 些 方法 超出 了 本 书 范围 . 如 果 你 有 兴趣 学 习 这 些 方法 , 可 以 奉 
阅 本 章 最 后 的 参考 文献 . 





Z -1.91 




















JG) 
I 2r. 
Fi 
ppt P 
— n = 72 “aa = T 
.— ista — 
图 8.5 例 8.6 H% =78 时 犯 工 型 错误 的 概率 6B 
计算 大 样本 Z 检验 的 B 
AE Hy: 9=b 显著 性 水 平 a 的 大 样本 检验 . 对 于 菜 个 备 择 值 9=0,, B 值 如 下 计算 : 


上 侧 检验 : B=P(Z «Ds 


其 中 的 =。 +2z。08 是 相应 于 拒绝 域 边 界 的 估计 量 的 值 . 
TAE. B=P(2> e) 


0 


X 6, = 0, -zoEdEET4ASGE ETE 0 a. 





双 侧 检验 : a= p[* 6. Ze] 


[AP og 


其 中 bo=b noi. Oo, o6 -zu05 是 相应 于 拒绝 城 边界 的 估计 量 的 信 . 


理论 练习 fü) = 


2m 
8.7 BÆN, von, y, OE BUR AUS ER, FE 、 、 
o^ =1 的 正 态 总 体 , BH 的 一 个 随机 样本 , 证 明 样本 的 似 然 函 数 工 是 
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= 1 "o Ehio À 2e OA 
L(u) — ( >) _ a 4 n ; 4 
8.8 参考 练习 8.7, 假如 想 检验 Hoi n = 0, 对 备 择 (提示 : 利用 D -D = Ey - ny. ) 


假设 H,: >0. AX u IO ba. — y, 那么 似 然 比 





检验 统计 量 为 8.9 参考 练习 8.7 和 8.8, 证 明 : 拒 绝 域 A<A, 与 
L(m) L(0 拒绝 域 7> 是 等 价 的 , 其 中 P(A SA.) = a, 
^7 Mg) Lo) P(yzy,) =e. (提示 : 利用 当 | a | — oo 时 ， 

证 明 : e 9.) 


8.4 选择 原 假 设 和 备 择 假 设 


现在 我 们 要 进行 一 个 大 样本 统计 假设 检验 , 如 何 计算 p 值 -一 如 果 9 实际 上 等 于 某 个 备 择 什 
0-0, 没 能 拒绝 Ho: 9= 0 的 概率 , 选择 原 假设 和 备 择 假设 的 逻辑 可 能 是 有 意义 的 . 选择 的 原则 是 把 
希望 支持 的 观点 (或 者 是 想 发 现 是 否 为 真 ) 通 常 作为 备 择 假设 , 因为 如 果 数 据 支持 H,( 即 如 果 拒 绝 
Ho), RITES EEN a WE, 也 就 是 弃 真 的 概率 . 例如 在 例 8. 5 中 ,路 政 署 认 为 某 段 州 际 公路 的 重 
型 货车 通过 量 的 平均 值 超过 了 每 小 时 72 辆 . 因此 路 政 署 设 置 备 择 假设 为 4; n >72. 相反 , 如 果 我 们 
选择 想 支 持 的 观点 作为 原 假设 ,而且 数 据 支持 该 观点 , 即 检验 不 拒绝 Ho, 那么 需要 去 研究 对 于 某 个 
指定 备 择 的 8 值 . 显然 , 如 果 可 能 的 话 ,希望 能 回避 这 个 完 长 乏味 而 且 有 时 极端 困难 的 任务 . 

实际 应 用 中 出 现 的 另 一 个 问题 是 应 该 进行 单 侧 检验 还 是 双 侧 检验 , 这 个 决策 依赖 于 你 想 发 现 什么 
例如 , 假定 你 经 营 一 家 化 工厂 , 每 天 的 产量 用 变量 了 表示 , MUR E(Y) =u 低 于 每 天 100 吨 , 那么 工厂 最 
终 会 破产 ; WMA u 超过 100 n, 则 能 保证 工厂 资金 正常 运转 . 为 了 判断 工厂 是 否 会 出 现 财务 危机 , 我们 
需要 判断 是 否 久 <100 吨 , 从 而 进行 Ho : p=100 对 H,: < 100 的 单 侧 检验 . 如 果 这 种 情况 下 你 建立 了 双 
侧 检 验 , 那么 便 会 减 小 发 现 小 于 100 吨 的 机 会 , 也 就 是 增加 了 对 pu < 100 吨 备 择 值 的 68 值 . 

再 举 一 个 例子 , 例如 , 你 想 研制 一 种 新 药 , 要 求 这 种 新 药 的 平均 药 效 是 某 一 确定 的 水 平 (如 
10%). 由 于 平均 药 效 超过 10% , 经 营 亏 本 ; 如 果 达 不 到 10% , 不 能 作为 一 种 有 效 的 药物 ( 仍 是 经 营 
FÆ). 对 于 这 种 情况 下 平均 药 效 /的 检验 , 希望 知道 是 否 大 于 或 者 小 于 j=10. 因此 你 会 选择 备 
择 假设 Hs se 10 进行 双 侧 统计 检验 (或 者 构造 置信 区 间 ) 

这 些 例子 都 表明 统计 检验 是 为 了 发 现 与 原 假设 H, 偏离 的 尝试 , 检验 的 关键 是 确定 你 想 要 发 现 
指定 的 备 择 . 但 是 我 们 必须 强调 ,Ho 和 H, 是 在 得 到 ， 并 观测 到 样本 数据 前 事先 确定 的 . 如 果 我 们 根 
据 样本 数据 信息 帮助 选择 H, 入， 那么 由 样本 获得 的 先 验 信息 会 使 检验 结果 偏 倚 , 尤其 是 犯 型 
错误 的 真实 概率 会 比 预先 选取 的 a 值 大 . 

某 厂 质量 控制 检查 员 定期 检测 生产 车 床 , 看 它 加 工 的 机 床 轴承 的 平均 直径 是 否 为 0.5 in. 
如 果 轴 承 的 平均 直径 大 于 或 小 于 0.5 in, 则 表明 车 床 工作 状态 失控 , 需要 进行 调整 . 建立 原 假设 和 备 
择 假设 以 检验 轴承 生产 过 程 是 否 失控 . 

解 。 假设 必须 由 总 体 参数 描述 , 因此 定义 = 由 车 床 生产 的 所 有 轴承 的 真实 平均 直径 . 如 果 j > 
0.5 或 «0.5, 则 表明 车 床 生产 过 程 失控 . 由 于 我 们 希望 能 发 现任 何 一 种 可 能 性 , 所 以 建立 原 假设 和 
备 择 假设 如 下 : 





Ho: =0.5( 即 过 程 在 控 ) 
H,: 0. 5CBUSEREU F2) 
在 8.5 ~8. 12 节 中 , 我 们 会 进一步 地 讲述 本 章 提出 的 假设 检验 逻辑 的 应 用 . 考虑 的 情况 是 第 7 章 
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给 出 估计 方法 时 的 几 种 情况 . 因为 所 涉及 的 理论 和 原理 是 基于 第 7 章 及 8.1 ~ 8.4 35, 我 们 只 在 每 种 
情况 下 给 出 单 侧 和 双 侧 检验 的 假设 检验 方法 的 总 结 . 


- 8.13 软件 销售 商 等 级 . Computerworld 杂志 每 年 都 会 
应 用 练习 对 所 有 计算 机 软件 销售 商 Datapro 等 级 评价 作出 一 


e DIODORUS GERIRMUERÉE — 34825. 由 随机 选择 的 软件 使 用 者 从 可 靠 性 、 使 用 
T ` x E H 4 x. AL 一 M» , 

8.10 dubesust. UTIRAR A E dr Wala MAE 
TISERHTEHU AR RUN GRE s RE 0. 5. » , 


8.11 ARR nis. 某 渔网 强生 产 商 想 证 明 他 的 竞争 起 知道 他 们 销售 产品 的 平均 Datapre ALIE T 
对 手 生产 的 22 lb 网 绳 的 平均 断裂 强度 实际 上 低 于 ' 
22 lb. 14 ”土壤 中 镭 的 含量 , 环境 保护 署 打算 检验 佛 罗 里 
8.12 HAM EBHRCT. 一 位 掷 般 子 游戏 的 赌 徒 在 财 达州 某 郡 土壤 中 镭 226 的 平均 含量 是 否 超过 了 最 
桌 上 经 历 了 一 -长 串 倒 均 , WEERT ER T, 大 允许 值 pCi/L. 
也 就 是 说 ,多 次 掷 两 颗 般 子 出 现 7 点 的 比率 并 不 等 8.15 ”实时 调度 . 工业 工程 师 想 比较 在 制造 过 程 中 两 
于 1/6( 如 果 恰 子 是 公平 的 , 那么 出 现 “7” 点 的 概率 种 实时 调度 方法 . 特别 地 , 他 们 希望 确定 两 种 方法 
是 1/6). 生产 的 产品 平均 个 数 是 否 不 等 


8.5 检验 总 体 均值 


例 8. 5 rh, 讲述 了 基于 标准 正 态 z 统计 量 进行 单个 总 体 均 值 的 大 样本 检验 ,这 个 检验 的 要 素 总 
结 在 下 面 . 


2 























总 体 均值 A 假设 的 大 样本 (天 =30) 检验 
单 侧 检 验 双 侧 检验 
Hy: u =o Hy; u =i 
H,: p> (XH: pn <j) H,: ZD 
检验 统计 量 : 检验 统计 量 : 
Z z (y -i)/05 7 (Y - ug ) (s/n) Z - (Y -uo)/a5 7 (Y - ug) / s/n) 
拒绝 域 : Z> (RE Z< -z ) 拒绝 域 : |Z] >z 
KP P(Z>z,) =a, P(Z»z,,) =0/2. (È: po 表示 原 假设 中 指定 的 几 的 某 个 数值 .) 
假定 ; 没有 (无 论 被 抽样 总 体 是 何 种 分 布 ， 中 心 极限 定理 都 可 以 保证 了 近似 服从 正 态 分 布 ). 








同一 种 类 动物 的 及 骨 大 致 具有 相同 的 长 宽 比 . 当 发 现 及 骨 化 石 时 考古 学 家 常常 通过 考察 及 
骨 的 长 宽 比 来 确定 物种 . 已 知 某 类 动物 A 的 平均 比 为 8. 5. 假如 在 动物 A 曾经 栖息 过 的 东非 某 个 考古 
AEMT 41 块 肪 骨 化 石 ,假定 发 据 的 这 些 肪 骨 化 石 都 属于 同一 种 未 知 的 动物 类 . ) 测 量 这 些 肢 骨 的 
长 宽 比 并 列 于 表 8.2. 

表 8.2 及 骨 样本 的 长 宽 比 


10. 73 8. 89 9. 07 9. 20 10. 33 9.98 9. 84 9. 59 
8. 48 8.71 9.57 9.29 9.94 8. 07 8. 37 6. 85 
8.52 8. 87 6.23 9.41 6. 66 9.35 8.86 9.93 
8.91 11.77 10.48 10.39 9.39 9.17 9. 89 8.17 
8.93 8. 80 10.02 8. 38 11. 67 8. 30 9.17 12. 00 
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希望 检验 的 假设 是 这 种 动物 的 肪 骨 总 体 平均 比 人 等 于 8.5, 对 备 择 假设 ; u 不 等 于 8.5, 即 我 们 
希望 检验 发 据 的 肪 骨 是 否 来 自动 物 A. 

a. 假定 希望 弃 真 概率 很 小 , 也 就 是 避免 犯 1 型 错误 是 重要 的 . 那么 选择 一 个 合适 的 显著 性 水 平 a 值 . 

b. 用 a 中 所 选 的 显著 性 水 平 检验 总 体 长 宽 比 均值 是 否 不 等 于 8. 5. 

解 a 在 所 提出 的 假设 检验 方法 中 , 可 以 根据 需要 选择 任意 的 显著 性 水 平 : 由 于 显著 性 水 平 a 
就 是 犯 D 型 错误 的 概率 ,因此 我 们 会 选择 一 个 很 小 的 a. 一 般 来 讲 , 认为 犯 T 型 错误 会 造成 严重 实际 
后 果 的 研究 人 员 会 取 很 小 的 a 值 , 比如 a 20.01. 有 些 研究 人 员 认 为 犯 型 错误 不 会 在 实际 中 造成 严 
重 后 果 , 可 能 愿意 容忍 较 大 的 a 值 , 如 0. 10. 在 这 个 例子 中 , 我 们 取 a =0.01 进行 检验 . 

b. 我 们 用 公式 建立 如 下 假设 : 

Ho: n=8.5 

H,: 从 天 8.5 
ATARA u - 8.5 在 两 个 方向 上 的 偏离 , 所 以 这 是 一 个 双 侧 检验 . 样本 足够 大 (n=41) ,因此 可 以 
对 进行 大 样本 检验 . f) 

在 显著 性 水 平 a 20.01 F, 对 这 个 

双 侧 检验 ,车 

|Z | 5245 = 20,005 
即 如 果 Z < -2.58 或 者 Z>2.58 BF, 便 
拒绝 原 假设 . 拒绝 域 如 图 8. 6 所 示 . 

将 表 8.2 的 数据 输入 计算 机 中 , 得 
到 如 图 8.7 所 示 的 SAS 输出 的 概括 统计 拒绝 H, | E 
量 . y =9.257 Fl s = 1. 203 (输出 中 阴影 一 z000s ^ —2.58 —Z00057 2.58 
部 分 ) 用 于 计算 检验 统计 量 观测 到 的 检验 统计 量 的 值 

Y-Ho 9.257 -8.5 
“da 2037y l 图 8.6 48.8 的 拒绝 域 
CÈ: 检验 统计 量 的 值 也 是 图 8. 7 中 的 阴影 部 分 . ) 


Sample Statistics for LHRATIO 





CE 一 
2 70.005 





^ 


Z 








Hypothesis Test 


Null hypothesis: Mean of LHRATIO = 8.5 








Alternative: Mean of LHRATID ^- 8.5 
t Statistic Df Prob » t 
4.030 40 0.0002 





图 8.7 #J8. 8 的 SAS 输出 


因为 检验 统计 量 的 值 落 入 拒绝 域 ( 见 图 8.6), 我 们 拒绝 Ho, 认为 这 种 动物 肪 骨 长 宽 比 的 均值 与 
8.5 有 显著 差异 . 如 果 原 假设 实际 上 为 真 ( 即 如 果 j = 8.5) ， 我 们 错误 地 拒绝 原 假设 的 概率 
为 a=0.01. 

进一步 研究 例 8. 8 所 得 结果 的 实际 含义 . 在 考古 现场 发 现 的 可 能 是 某 种 不 同 于 A 的 动物 . 还 有 
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一 种 可 能 就 是 这 种 动物 属于 A, 但 是 由 于 非 正常 的 食物 习惯 使 得 其 肪 骨 的 长 宽 比 大 于 一 般 的 均值 . 
由 此 , 统计 上 显著 的 结果 并 不 总 是 实际 上 显著 的 结果 . 所 以 研究 者 要 利用 其 他 的 标准 、 论 题 的 知识 
和 所 研究 的 现象 保持 客观 性 , 判断 实际 的 显著 性 . 

总 体 均 值 的 小 样本 统计 检验 推断 ( 如 与 之 关联 的 7.4 节 置 信 区 间 ) 是 基于 样本 数据 是 正 态 分 布 随 
机 变量 的 独立 观测 值 的 假定 . 检验 统计 量 是 基于 7.4 节 给 出 的 了 分 布 . 

统计 检验 的 要 素 列 在 下 面 . 正如 第 7 章 的 建议 , 即使 被 抽样 的 总 体 是 适度 的 非 正 态 、 小 样本 检验 
还 是 具有 下 面 框 格 中 所 列 的 性 质 . 然而 , 如 果 数 据 与 正 态 性 有 较 大 的 偏离 ( 即 较 大 偏 倚 的 数据 ), 我 
们 必须 采用 将 在 15 章 讨论 的 非 参 数 技术 . 





总 体 均 值 jx 的 小 样本 假设 检验 
3€ 4n] y 双 侧 检验 
Hy: p= Ho: p= po 
H,: K> (XE H,: <) H, : Zo 
oa p_ Ūko 
检验 统计 量 ; 了 = vn 
拒绝 域 : T»u (RET - t.) 拒绝 域 : | 了 | >t 


其 中 + 分布 的 自由 度 为 (n 一 1), P(T>t,) =a, P(T»1,4) =0/2. 

假定 : 被 抽取 样本 的 总 体 相 对 频率 分 布 是 近似 正 态 的 . 

警告 : 如 果 数 据 明 显 偏 离 正 态 性 , 那么 这 种 小 样本 检验 可 能 导致 错误 的 推断 . 对 于 这 种 情况 , 我 们 可 以 
采用 将 在 15.2 节 讨论 的 非 参 数 符号 检验 . 














科学 家 指出 经 常用 于 合成 塑料 制品 的 化 学 溶剂 葵 可 能 会 致癌 . 研究 表明 在 有 莱 环 境 下 工作 
五 年 以 上 的 人 , 白血病 的 发 生 率 是 普通 人 群 的 20 f. 因此 , 联邦 政府 把 工作 场所 允许 的 节 含 量 最 高 
水 平 由 原来 的 百 万 分 之 十 (10 pm 降低 至 百 万 分 之 一 . 假定 职业 安全 与 卫生 管理 局 ( OSHA ) 调查 某 
钢铁 制造 厂 , 该 厂 工 人 每 天 都 在 有 芋 的 环境 下 工作 . 在 一 个 月 中 随机 选取 了 20 份 空气 样品 , 检测 其 
HENSE, 所 得 数据 列 于 表 8.3. 该 钢铁 制造 厂 违反 了 新 的 政府 标准 吗 ? 在 显著 性 水 平 a =0.05 
F, 检验 钢铁 厂 茶 含量 的 平均 水 平 是 否 超 过 1 ppm. 


表 8.3 20 份 空气 样品 的 茶 含 量 


0.21 1.44 2.54 2.97 0. 00 3.91 2.24 2.41 4. 50 0. 15 
0.30 0. 36 4. 50 5.03 0. 00 2. 89 4.71 0. 85 2. 60 1.26 


R ”职业 安全 与 卫生 管理 局 希望 把 钢铁 厂 茶 含 量 的 平均 水 平凡 超过 1 ppm 作为 研究 假设 . 这 种 
小 样本 单 侧 检 验 的 要 素 包 括 : 
Ho: #=1 
H,:u»1 
L2 了 一 No 
检验 统计 量 : 了 = va 
假定 : 钢铁 制造 三 所 有 空气 样本 的 茶水 平 总 体 相 对 频率 分 布 是 近似 正 态 的 . 
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拒绝 域 : 对 于 w=0.05, 自由 度 为 (n -1) 219, 车 了 >io 0s = 1. 729 (EEH H (ILE 8.8). 


样本 数据 的 概括 统计 量 见 图 8.9 的 o 
MINITAB 输出 .了 和 * 的 值 (着 重 显示 ) 分 别 
是 7=2. 143 和 s=1.736. 

我 们 现在 计算 检验 统计 量 : 

_y-1_ 2.143-1 _ 
s/n 1.736220 

(E. 图 8.9 也 给 出 了 了 的 值 ( 着 重 显 
示 ). ) 

由 于 计算 的 了 值 落 入 拒绝 域 ， 职业 安 
全 与 卫生 管理 局 认为 凡 >1 ppm, 该 厂 违 反 











0 |. t 
T = 2.95 
拒绝 域 — 
tn0s™1.729 
图 8.8 例 8.9 的 拒绝 域 
了 新 的 政府 标准 . 与 这 一 推断 关联 的 可 靠 性 为 a = 0. 05. 这 意味 着 , 如 果 反 复 地 应 用 于 从 工厂 收集 的 


数据 的 随机 样本 , 职业 安全 与 卫生 管理 局 只 有 5% 的 检验 错误 地 拒绝 Ho. 因此, 职业 安全 与 卫生 管理 
号 十 分 确信 (95% 置信 ) 该 厂 违反 了 新 的 标准 ， 





One-Sample T: BENZENE 


Test of mu = 1 vs > 1 





95$ 


Lower 
Variable N Hean StDev SE Mean Bound T P 
BENZENE 20 2.14350 1.73602 0.38819 1.47228 2.95 0.004 





图 8.9 例 8.9 ñ MINITAB 输出 


应 用 练习 

8.16 管道 的 表面 粗糙 度 ， 参考 练习 7.24, Anti- cor- 
rosion Methods and Materials (2003 年 第 50 35) 研究 
了 油田 管道 内 层 表面 粗糙 度 . 表 中 给 出 了 20 个 抽 
样 管道 的 数据 ( um). 


一 一 一 _ Ll. 
172 250 216 213 106 224 231 20 10 140 


2.57 2.64 1.26 205 1.19 2.13 1.27 1.51 2.41 1.95 


资料 来 源 ; Farshad, F. , and Pesacreta, T. "Coated pipe interior sur- 
face roughness as measured by three scanning probe instruments. ” An- 
ti- corrosion Methods and Materials, Vol. 50, No. 1, 2003(# M). 


a 对 检验 管道 内 表面 平均 粗糙 度 j 是 否 不 同 于 
2 um 给 出 原 假设 和 备 择 假 设 . 

b. 求 假设 检验 的 检验 统计 量 . 

c， 当 a =0.05 时 , 给 出 假设 检验 的 拒绝 域 . 


d. 陈述 假设 检验 的 合适 结论 . 

e. 在 练习 7.24 中 , CARIT u h95% 置信 区 间 . 
说 明 为 什么 置信 区 间 和 检验 统计 量 会 得 出 有 关上 
同样 的 结论 . 


8. 17 ”燃气 轮机 的 冷却 方法 . 在 用 电 高 峰 期 , 尤其 是 


炎热 夏季 的 月 份 里 ， 燃气 轮机 的 输出 功率 大 幅度 降 
低 . 防御 功率 降低 的 一 种 方法 是 冷却 燃气 轮机 的 入 
风 . 盛行 的 普通 冷却 办 法 是 采用 高 压 雾 状 入 风 . Jour- 
nal of Engineering for Gas Turbines and Power(2005 年 
1 月 ) 中 曾 对 采用 高 压 雾 状 入 风 的 67 台 燃 气 轮机 的 
样本 性 能 做 过 调查 研究 ， 性 能 的 一 个 度量 是 热 消耗 
3 (k]/kWh) , 保存 在 GASTURBINE 文件 中 的 67 台 
燃气 轮机 的 热 消 耗 率 数据 列 于 下 表 . 假如 一 台 标 准 
的 燃气 轮机 的 热 消耗 率 平均 为 10 000 kJ/kWh. 进行 
检验 确定 采用 高 压 雾 状 入 风 的 燃气 气 轮机 平均 热 消耗 
率 是 否 超过 10 000 kJ/kWh, a =0. 05. 
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14 622 13 196 11 948 11 289 11 964 
14 628 13 396 11 726 11 252 12 449 
11 510 10 946 10 508 10 604 10 270 
11 842 10 656 11 360 11 136 10 814 
10 481 9 812 9 669 9 643 9 115 
9 421 9 105 10 233 10 186 9 918 


10 526 10 387 10 592 10 460 10 086 
11 030 10 787 10 603 10 144 11 674 
10 529 10 360 14 796 12 913 12 270 
13 523 1i 289 11 183 10 951 9 722 
9 115 11 588 10 888 9 738 9 295 
9 209 9 532 9 933 9 152 9 295 


16 243 14 628 12 766 8 714 9 469 11 948 12 414 
— E 7 


8. 


œ 


18 河水 的 碱 度 . 练习 5.26 中 曾 提 到 , 取 自 韩国 
首尔 汉 河 水 样 的 平均 碱 度 为 50 mg/L. ( Environmen- 
tal Science & Engineering 2000 £ 9 H 1 H ) 考 虑 从 
汉 河 某 支流 收集 的 100 份 水 样 的 随机 样本 , 假定 样 
本 碱 度 的 均值 为 了 = 67.8 mg/L, REEN s= 
14. 4 mg/L. 是 否 有 充足 的 证 据 表明 支流 河水 总 体 
平均 碱 度 水 平 超过 了 50 mg/L? (a =0.01) 


.19 Hb RE. 目前， 人 们 常 采用 X 射线 和 激光 技 


术 来 检验 印刷 电路 板 (PCB) 焊 颖 缺陷 .( Quality Con- 
gress Transactions, 1986. ) 某 制造 商 生产 基 于 激光 技 
术 检验 焊 颖 的 设备 ,声称 当 焊 缝 裂 开 0. 1 in 间隙 时 ， 
他 们 的 产品 平均 每 秒 钟 至 少 能 检测 10 A ag. 一 个 
可 能 的 买主 对 48 台 不 同 的 PCB 进行 了 检验 . 每 台 设 
备 恰好 运行 s, 每 次 运行 检测 到 的 焊 颖 数量 如 下 ; 


10 9 10 10 11 9 12 8 8 9 6 10 
7 10 11 9 9 13 9 10 11 10 12 8 
9 9 9 712 6 0910 1010 8 7 9 
11 12 10 0 101 10 9 7 9 9 10 


a 买主 想 知 道 样 本 数据 是 否 驶 斥 了 制造 商 的 声称 . 
确定 买主 希望 检验 的 原 假设 和 备 择 假设 . 

b. 在 本 练习 中 ，I 型 错误 是 什么 ? [型 错误 又 是 
什么 ? 

c. 进行 a 中 描述 的 假设 检验 , 并 用 本 练习 的 内 容 
解释 检验 结果 . a =0. 05. 


.20 土壤 中 的 鳃 含量 . 458226 会 自然 地 释放 放射 性 


气体 , 在 主要 城市 戴 德 郡 ( 佛罗里达 州 ) A T 48 
226 水 平 的 升 高 ( Florida Scientist, 1991 年 夏 / 秋 ). 
取 自 戴 德 那 南部 的 26 份 土壤 样品 中 镭 226 水 平 
(单位 : 微微 居 里 / 升 , pCi/L) 列 于 下 表 . 美国 环保 
EGRE 226 最 大 暴露 水 平 为 4.0 pCi/L. 确定 取 自 
戴 德 那 南部 的 土壤 样品 镭 226 水 平 的 均值 是 否 低 
于 美国 环保 署 的 限制 4.0 pCi/L. a = 0. 10. 

1.46 0.58 4.31 1.02 0.17 2.92 0.91 0.43 0.91 
1.30 8.24 3.51 6.87 1.43 1.44 4.49 4.21 1.84 
5.92 1.86 1.41 1.70 2.02 1.65 1.40 0.75 
资料 来 源 : Moore, H. E. , and Gussow, D. G. "Radium and ra- 
don in Dade County ground water and soil samples." Florida Sci- 
entist, Vol. 54, No. 3/4, Summer/ Autumn, 1991 , p. 155( 3&3). 
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机 床 系统 性 能 . 用 计算 机 模拟 来 研究 机 器 故障 
对 制造 系统 性 能 的 影响 ( Industrial Engineering , 
1990 年 8 月 ). 模拟 是 针对 单个 机 床 系统 的 几 个 特 
性 来 进行 的 , 它 包 括 : 平均 到 达 时 间 为 1.25 min, 
不 变 的 处 理 时 间 为 1 min, 机 床 故 障 时 间 为 10%. 
经 n=5 次 时 长 为 160 h 的 独立 模拟 运行 , 结果 每 
F 40 h 的 平均 产量 为 了 = 1908. 8 件 . 然而 对 于 一 个 
无 故障 运行 的 机 床 系统 ,一 周 40 h 的 平均 产量 等 
于 1920 fF. 假定 5 个 样本 运行 的 标准 差 为 ;= 每 周 
40 h 18 fF. 检验 系统 每 周 40 h 的 平均 产量 是 否 低 
于 1 920 f£. (a 20.05) 

.22 SAU 1$ 3S. Environmental Science & Technolo- 
gy(1999 年 10 月 ) 报 告 了 一 项 有 关 荷 兰 土壤 污染 的 
人 研究, 共 抽 样 了 72 400 g 土壤 样品 , 干燥 并 分 析 其 
中 的 氯 化 物 污染 物 . 利用 红外 显 微 法 测定 每 个 土壤 
样品 的 氧化 物 浓度 (mg/kg) , 结果 为 毛 化 物 平均 浓 
度 7=84 mg/kg, 标准 差 ;=80 mg/kg. 

a 检验 荷兰 土壤 中 氯 化 物 浓度 的 真实 均值 低 于 
100 mg/kg 的 假设 . a =0. 10. 

b. 当 a =0.05 时 是 否 得 到 与 a 相同 的 结论 ? o = 
0.01 Jg? 并 解释 原因 . 

-23 RIER. 当 钻 孔 的 深度 与 孔 的 直径 之 比 大 于 

10 时 , 采用 “ 深 孔 ”钻探 方法 . 深 孔 钻探 成 功 与 否 

依赖 于 钴 悄 排 出 的 满意 性 . 进行 一 项 试验 研究 出 现 

A E OLEUM , 深 孔 钻探 的 运行 状况 (Journal of En- 

gineering for Industry, 1993 年 5 月 ). H 50 h hg 

的 长 度 (mm)， 得 到 如 下 概括 统计 量 : 均值 了 = 

81.2 mm, FË s = 50.2 mm. To uh f HC Er BAI CC 

均值 是 否 不 同 于 75 mm. a =0. 01. 

24 污水 管 强度 . 某 城市 的 建筑 规格 要 求 在 居民 区 

使 用 的 污水 管 平均 断裂 强度 超过 2 500 Ib 每 线 英 

R. 一 位 制造 商 愿意 向 城市 提供 污水 管 , 并 提交 投 

ËR, 还 提供 如 下 信息 : 一 个 独立 的 承保 人 随机 抽取 

7 节制 造 商 的 水 管 , 并 检测 每 一 节 的 断裂 强度 , 结 

果 ( 磅 / 线 英尺 ) 如下: 


2610 2750 2420 2510 2540 2490 2 680 


— — T_T -— — 
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BS Gmm Semak (usu 
到 所 要 求 的 规格 ? 利用 a = 0.10 gae 155 


X. 8.25 参考 练习 8.7 ~ 8.9, 证 明 : 似 然 比 检验 的 拒 
b. 对 j=74, 求 B 值 . 检验 功效 是 多 少 ? HIRE Z >z, 其 中 P(Z»2,) =a. 
c. 对 人 =1.015, ok 8 ft. (提示 : BOE H: =0 HA, 证 明 Va(7) 为 标准 正 
d. Xf u, =1.045, 求 检 验 功 效 . 态 随机 变量 . ) 


8.6 检验 的 观测 显著 性 水 平 


根据 前 几 节 讲述 的 统计 检验 方法 ,在 检验 之 前 要 事先 确定 o 值 和 相应 的 拒绝 域 , 并 且 结论 应 说 成 
拒绝 或 不 拒绝 原 假设 . 给 出 统计 检验 结论 的 第 二 种 方法 是 报告 检验 统计 量 与 原 假设 的 不 臻 程度 ,然后 
由 检验 人 员 自 己 决定 是 否 拒绝 原 假设 . 这 种 不 一 至 性 的 度量 称 为 检验 的 观测 显著 性 水 平 (或 者 p 值 ) C. 

定义 8.4 ”一 个 统计 检验 的 观测 显著 性 水 平 , 或 p 值 是 观测 到 检验 统计 量 一 个 值 至 少 如 从 样本 
数据 计算 的 统计 量 值 那样 与 原 假设 矛盾 ,上 且 支 持 备 择 假设 的 概率 . (假定 H, 为 真 . ) 

许多 研究 者 发 表 于 杂志 、 案 例 研究 、 报 告 等 假设 的 统计 检验 结果 是 用 bp 值 表示 的 ,而 不 是 事先 
选择 ",， 然后 按照 本 章 所 述 的 方法 进行 检验 , 研究 者 可 以 计算 并 报告 合适 的 检验 统计 量 , 以 及 相应 的 
p (E. 由 报告 的 读者 自己 判断 结果 的 显著 性 , 也 就 是 说 , 读者 必须 根据 报告 的 p 值 来 决定 是 否 拒绝 原 
假设 而 接受 备 择 假 设 . 一 般 ， 只 当 观 测 的 显著 性 水 平 小 于 读者 选 定 的 显著 性 水 平 a 时 ,拒绝 原 假设 . 
以 p 值 报告 检验 结果 有 两 个 优点 :(1) 如 果 读者 按照 本 章 列 出 的 方法 执行 标准 的 假设 检验 , fe Vel 
拌 一 个 愿意 容忍 的 最 大 a 值 ，(2) 便于 计算 机 运算 给 出 检验 结果 . 许多 统计 软件 包 都 可 以 进行 检验 计 
算 ， 给 出 检验 统计 量 观测 值 ， 然后 由 读者 自己 形成 结论 . 还 有 一 些 是 给 出 检验 的 观测 显著 性 水 平 ， 这 
样 更 便于 用 户 决定 是 否 拒绝 原 假设 . 

EEE 求 例 8.5 中 统计 检验 的 观测 显著 性 水 平 ， 并 解释 结果 . 

BR 在 例 8.5 中 , 我 们 检验 了 一 段 25 mile 长 的 州 际 公路 上 每 小 时 重型 货运 卡车 均值 的 假设 . 
由 于 希望 发 现 大 于 po =72 的 值 ， 所 以 进行 单 侧 检 验 , 当 了 值 或 Z 值 较 大 时 拒绝 Ha. 由 随机 抽取 的 
50 个 1 小 时 样本 计算 的 Z 的 观测 值 为 Z=1. 12. 因为 任何 大 于 Z=1.12 的 Z 值 都 更 背离 Ha, 所 以 此 
检验 的 观测 显著 性 水 平 是 : 

p 值 =P(Z=1.12) 

这 个 值 相应 于 图 8. 10 中 分 布 上 尾 阴影 部 分 fO 
的 面积 . 由 附录 B de 5 可 以 查 得 相应 于 z=1.12 的 
面积 A 等 于 0. 3686. 从 而 , 观测 的 显著 性 水 平 是 
P 值 = P( Z>1. 12) =0. 5 - A =0. 5 -0. 3686 =0. 1314 

这 个 结果 表明 在 这 种 情况 下 ( 若 Ho 实际 上 为 
F), 观测 到 一 个 至 少 与 Hy 矛盾 的 = 值 的 概率 是 
0.1314. 因此 只 要 预先 选择 的 o 大 于 0. 1314, 我 
们 将 拒绝 Ho. 回忆 路 政 署 选 择 | 型 错误 的 概率 
a=0.10. 既然 20.10 /]-F p f, 那么 路 政 署 就 Z= 1.12 

图 8.10 当 z=1.12 时 求 上 侧 检验 的 p 值 











O p 值 或 者 概率 值 是 统计 方法 使 用 者 杜 所 的 . e p 值 表示 式 中 的 p 不 要 与 二 项 参数 RET. 
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没有 充足 的 证 据 拒绝 Hu. 这 一 结论 与 例 8. 5 的 结论 一 致 . 
假定 例 8. 5 的 检验 是 双 侧 检验 , 即 假定 感 兴趣 的 备 择 假 设 是 已 : wz72. 求 此 检验 的 观测 
显著 性 水 平 , 并 解释 结果 . 与 例 8. 5 一 样 , 设 =0. 10. 

解 ”如果 检 验 是 双 侧 的 , 那么 很 大 或 很 小 的 Z 值 都 与 原 假设 Ho u =72 矛盾 . 因此 大 于 1. 12 或 
小 于 -1.12 的 Z 值 比 观测 到 的 Z=1.12 更 与 有 忒 盾 . 所 以 此 检验 的 观测 显著 性 水 平 ( 图 8.11 的 阴 
影 部 分 ) 是 : 

p 值 =P(Z=1. 12) +P(Z< - 1.12) =2(0. 1314) =0. 2628 
因为 希望 在 a = 0. 10 显著 性 水 平 进行 双 侧 检 验 , 又 因为 p 值 超过 了 a, 所 以 我 们 仍 没有 充分 证 据 拒 
2t Hy. 
对 于 例 8. 9 描述 的 小 样本 检验 , 求 观测 的 显著 性 水 平 , 并 加 以 解释 . 检验 的 显著 性 水 
FÆ a =0. 05. 

解 DIS.9 中 的 检验 是 Ho: w = 1 X| H: n > 1 的 小 样本 检验 . 由 样本 数据 计算 的 了 值 是 了 = 
2. 95， 所 以 此 检验 的 观测 显著 性 水 平 (或 值 ) 等 于 当 H, 实际 上 为 真 时 , 7 取 值 大 于 或 等 于 2.95 的 
概率 . 它 等 于 图 8. 12 中 了 分 布 上 尾 阴影 部 分 的 面积 . 为 了 求 这 个 面积 , 即 此 检验 的 bp 值 , 我 们 可 以 查 
7 分 布 表 ( 表 B.7). 
f) 

i f) 


19 个 自由 度 的 7 分 布 














Z = —1.12 Z = 1.12 T = 2.95 
图 8 .11 当 ==1 12 时 , 求 双 侧 检验 的 p 什 图 8.12 例 8.12 检验 的 观测 显著 性 水 平 


与 正 态 分 布 表 不 同 ， 表 B.7 只 给 出 了 相应 于 面积 0. 100, 0.050, 0.025, 0. 010, 0. 005, 0.001 和 
0.0005 的 i。 值 , 因此 只 能 得 到 检验 的 近似 p 值 . 观测 的 了 值 基于 19 4 由 度 ， 所 以 我 们 利用 表 B.7 
中 df =19 这 一 行 ， 在 这 一 行 中 寻找 最 接近 于 观测 值 7 =2. 95 的 i 值 . 相应 于 0.001 和 0. 005 的 p 值 ， 
ta 值 分 别 是 3.579 和 2. 861. 因为 观测 的 了 值 落 在 oool 和 加 oo 之 间 , 检验 的 p 值 也 位 于 0. 001 和 
0.005 之 间 . 我 们 可 以 用 插值 法 更 精确 地 确定 检验 的 p 值 ， 但 是 选择 较 大 的 面积 作为 p 值 对 我 们 的 目 
的 是 合适 的 、 容 易 的 , 所 以 我 们 取 p 值 为 0.005. 因此 , 对 大 于 0. 005 的 任意 a 值 , 我 们 都 会 拒绝 原 假 
É Ho: = 1 ppm. 由 于 此 检验 的 a = 0.05, 所 以 正确 的 结论 是 拒绝 Ho. 





YF E p fü 
大 样本 检验 : p dë SP(Zzz),d Lf 


pfüÉ-P(Zez), # Fl 
pi =2P(Z> |z. |), #3 W 
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EF z 是 检验 统计 量 的 计算 值 . 
小 样本 检验 : p ë =P(T>1.), EM 
p ë =P(T=<t.) , # F0 
p t -2P(Tz |t, |), #20 
其 中 i 是 检验 统计 量 的 计算 值 . 
GRE: |z. | 和 |i。 | 表示 z foi 的 绝对 值 , 自 总 是 正 值 . ) 








p 值 解释 
1. 选择 一 个 你 愿意 容忍 的 最 大 a 值 . 
2. 如 果 检 验 的 观测 显著 性 水 平 (p 值 ) 小 于 最 大 值 Qa， 则 拒绝 原 假设 . 


从 例 8.12 可 以 看 出 , FA TRK p 值 很 难得 到 一 个 精确 值 . 如 果 我 们 需要 一 个 精确 的 p fi 
可 以 求助 于 计算 机 . 图 8. 13 是 例 8.9 中 了 检验 MINITAB 的 输出 . 这 个 单 侧 检 验 的 精确 p 值 (输出 中 
阴影 部 分 ) 是 0. 004. 














One-Sample T: BENZENE 


Test of mu = 1 vs > 1 


95% 

Lower 
Variable N Mean StDev SE Mean Bound T P 
BENZENE 20 2.14350 1.73502 0.388190 1. 47228 2.95 QO0.00a 


KI 8. 13 重新 给 出 的 例 8. 9 的 MINITAB 输出 结果 
应 用 练习 8.28 MEFR. 参考 例 8.8 EFEK I HE KD 
8.26 单 侧 检 验 的 p 值 . ZBH: 0 = 0, E H,:0»0, R, 数据 存 于 BONES 文件 中 . 求 检验 M: n = 8.5 
的 大 样本 检验 , 求 下 列 与 每 个 检验 统计 量 值 关联 对 H.: 78.5 80 p 值 并 解释 











的 p 值 : 8.29 管道 的 表面 粗糙 度 . 参考 练习 8. 16, Anti- cor- 
a. z-1.96. rosion Methods and Materials ( Vol. 50 , 2003) 关于 油 
b. z=1. 645. 田 管 道内 表面 粗糙 度 的 研究 . 数据 存 于 ROUCH- 
c. z=2. 67. PIPE 文件 中 . Kio Hy: j=2 XE H, : 2 的 MINIT- 
d. z=1.25. AB 输出 如 下 图 . 计算 并 解释 检验 的 p 值 . 


œ 


8. 27 双 侧 检验 的 p 值 . BR Ho: 0 = 0, XE H,: 0*0 .30 HX p š. 对 下 列 练习 中 所 做 的 检验 , 计算 并 
的 大 样本 检验 , 求 下 列 与 每 个 检验 统计 量 值 关联 解释 p fH. 


的 p 值 : a. 练习 8.17. 
a. z= -1.01. b. 练习 8.18. 
b. z= -2.37. c. 练习 8.19. 
c. z 24. 66. d. 练习 8.20. 
d. z - 1.45. e. 2,2] 8.21. 





One-Sampie T: ROUGH 


Test of mu = Z vs not = 2 


Variable N Mean StDev SE Mean 95% CI T P 
ROUGH 20 1.88100 0.52391 0.11715 {1. 63580, 2.12620) -1.02 0.322 


练习 8. 29 的 MINITAB 输出 结果 
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8.7 检验 两 个 总 体 均 值 的 差 : 独立 样本 
考虑 分 别 来 自 均 值 为 jl 和 jz 的 两 个 总 体 的 独立 随机 样本 . 当 样 本 容量 较 大 时 ( 即 n, =30, H 


nz 230) ,对 于 两 个 总 体 均 值 差 (ji -po ) 的 假设 检验 是 基于 7.5 节 给 出 的 枢 轴 统计 量 z. 这 种 大 样本 


情况 下 的 检验 总 结 在 下 面 的 框 格 中 . 
关于 (mi -1 ) 假设 的 大 样本 检验 : 独立 样本 





单 侧 检 验 双 侧 检验 
Hy: (m =m) = D, H,: Qu 7i) = D, 
R,: (m -u5) ** D, 


H,: (4 -p2) > D, 
[3X3 H,: (u 7-93) < Do] 
检验 统计 量 ; pd - x) -D (n 2) -Do 
s S 


9 1-3) 
— + 





拒绝 域 ; 
Z>z, (Š Z< -z,) |Z| >z 
CÈ: D, 表示 原 假设 中 指定 的 (jv -Ha ) 某 个 数值 . 在 许多 实际 应 用 中 ,希望 假设 两 个 总 体 的 均值 不 存 





在 差异 , 在 这 种 情况 下 ,Do =0. ) 
假定 ; 1. 样本 容量 mm Pn ES$ RO, Hl n 230 H n, 730. 


2. 两 个 样本 是 从 目标 总 体 中 独立 、 随 机 地 选取 的 . 
LEER TERRE, 某 面包 店 在 制作 面包 时 采用 了 一 种 新 的 发 酵 方 法 . 分 别 从 采用 新 方法 之 
前 和 之 后 制作 的 面包 中 随机 抽样 ,并 分 析 其 热量 . 两 个 样本 分 析 的 结果 列 于 下 表 . 这 些 样本 是 否 能 提 
供 充足 的 证 据 证 明 因为 采用 新 的 发 醇 方法 使 每 个 面包 的 平均 热量 降低 了 . 用 a = 0. 05 检验 . 








新 方法 原 方法 
n, =50 n, =30 
y, =1 255 卡路里 y, =1 330 卡路里 
5, =238 卡路里 


s, 2215 卡路里 
E ”通过 对 一 个 假设 的 检验 ,能 很 好 地 回答 这 个 问题 . 定义 ua 为 用 新 方法 制作 的 每 个 面包 平均 


热量 , po 为 用 原 方法 制作 的 每 个 面包 平均 热量 . 希望 能 支持 研究 ( 备 择 ) 假 设 p > (EC — u) < 
0). 因此 , 我 们 将 检验 原 假设 (w -和 如) 20, MG -元 ) 等 于 一 个 较 大 的 负 值 时 , 我 们 便 拒 绝 原 假 


设 . 检验 的 要 素 如 下 : 
Ho: ( -pjp2) =0( 即 Do =0) 
H,: (pı -1p2) <0( 即 Hi <m) 


GL o (30-9 (epa Mm Kk pag 30) 





Z= 
9 i -y) 9 i -72) 

拒绝 域 : Z< -z = -1.645( 见 图 8. 14). 

假定 : 两 个 面包 样本 都 是 独立 选取 的 . 


检验 统计 量 : 
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我 们 现在 计算 : 
z. C) -0_ (1255-1330). -75 _ -75 2c 。_ 1 4 
2 (y, -72) vi c) sp sj (215)? (238)? 53.03 


nl no n, nm 50 30 

由 图 8. 14 可 见 ， 计 算 的 z 值 并 没有 落 入 拒绝 O 
域 . 所 以 在 显著 性 水 平 a =0.05 F, 样本 没有 提供 
充分 证 据 证 明 新 的 发 醇 方法 降低 面包 的 平均 热量 . 

当 样本 容量 ni 和 n, 不 够 大 时 ， 便 不 能 应 用 例 
8. 13 中 使 用 的 大 样本 方法 ,经 修正 执行 两 个 总 体 
均值 差 的 小 样本 假设 检验 , 小 样本 检验 方法 基于 比 
大 样本 情况 有 更 多 限制 的 假定 . 假设 检验 的 要 素 和 — 
所 需要 的 假定 列 在 下 面 的 框 格 中 . 提示 : 当 正 态 总 —! 





>= Z 








体 假定 严重 违反 时 ， 列 在 这 里 的 检验 将 是 无 效 的 ， _1.645 
这 时 , 必须 采用 非 参数 方法 (第 15 章 ). 图 8.14 例 8.13 的 拒绝 域 
关于 (Ai 79; 假设 的 小 样本 检验 : 独立 样本 
单 侧 检 验 双 侧 检验 
Hy: (m, -p12) = D, Hy: (m -pm) =D, 
H,: ( -1m) > D, H,; (Qu 7 uo) * D, 


[或 者 已 : (ui =i) <D,] 


检验 统计 量 ; T= Oi 7) -Do 


EC 
拒绝 域 : T >t. 拒绝 域 ， | 了 | >: 
[或 者 T< -1,] 
其 中 


2 (m -1)s + (n, -1)š 





n +n, 一 2 
了 分 布 自由 度 是 n, +n, -2. 
假定 ; 1. 抽取 样本 的 两 个 总 体 有 近似 正 态 的 相对 频率 分 布 . 
2. 两 个 总 体 的 方差 相等 ,， W o =o. 
3. 随机 样本 是 独立 地 取 自 两 个 总 体 . 
警告 : 当 正 态 总 体 的 假定 违反 时 ， 检验 可 能 给 出 错误 的 推断 . 这 种 情况 下 ,应 该 采用 15.3 节 介 绍 的 非 
参数 Wilcoxon 检验 . 











茶 工 厂 想 知道 可 燃气 体 和 电力 两 种 能 源 , 哪 种 能 以 较 低 的 成 本 产生 更 多 的 有 用 能 量 .，- 
种 度量 能 量 产 出 的 经 济 学 指标 叫做 工厂 的 单位 投入 产 出 ， 它 是 工厂 对 某 项 效用 的 投入 金额 美元 ) 除 
以 能 量 输出 量 ( 万 亿 英制 热量 单位 ) 计算 的 . 这 个 比率 越 小 , 表明 工厂 输出 能 量 的 成 本 越 低 选取 11 
个 使 用 电能 的 工厂 和 16 个 使 用 可 燃气 体 的 工厂 作为 独立 随机 样本 ， 并 分 别 计算 每 个 工厂 的 投入 产 
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出 比 , 数据 列 于 表 8.4. 在 显著 性 水 平 a =0. 05 F, 这 些 数据 能 提供 充足 证 据 证 明 所 有 使 用 电能 和 所 
有 使 用 可 燃气 体 的 工厂 投入 产 出 比 存在 差异 吗 ? 
表 8.4 例 8. 14 工厂 的 投入 产 出 数据 


电能 204. 15 0.57 62. 76 89. 72 0.35 85.46 
0.78 0.65 44.38 9.28 78. 60 

可 燃气 体 0.78 16. 66 74. 94 0.01 0. 54 23. 59 88.79 0. 64 
0. 82 91. 84 7. 20 66. 64 0.74 64. 67 165. 60 0. 36 


解 ” 设 ji 表示 所 有 使 用 电能 工厂 的 投入 产 出 均值 , uo 表示 所 有 使 用 可 燃气 体 工 厂 的 投入 产 出 

均值 . 我 们 想 进行 检验 : 
Ho: (ui 7-95) =0( 即 Ai =u2) 
H,: (pj -u2) #0( B} u; >u 或 上 € ua) 

利用 SPSS 给 出 两 个 样本 的 概括 统计 量 ，SPSS 输出 结果 见 图 8. 15. TEE y, 252.43, y, 231.74, 
5, 262.43, s, = 49. 05. 

为 了 得 到 检验 统计 量 , 首先 计算 : 

2 0 -1)si + (n2 -1)s? (101-1)(62.43)? + (16 - 1) (49.05)? 75 051.31 

P ny +n, 一 了 11 +16 -2 2 

其 次 , 如 果 能 够 假定 两 类 工厂 的 投入 产 出 比 近似 服从 正 态 分 布 , 且 有 相同 的 方差 , 那么 检验 统 
计量 是 : 





=3002. 05 


T- (i -72) -Do 52.43 -37.74 14.69 


1 1 1 1^ 21.46 
JG " x) oo. ost *16) 
图 8. 15 的 SPSS 输出 结果 给 出 了 检验 统计 量 和 此 检验 的 相应 p 值 . 由 于 双 侧 检验 的 p 值 (方差 相 
同情 况 ) , p 值 =0. 500 超过 了 a =0. 05, 所 以 没有 充足 的 证 据 拒 绝 H,. 
也 就 是 说 , 不 能 得 出 (a =0.05) 使 用 电能 与 可 燃气 体 的 两 类 工厂 的 投入 产 出 比 均值 存在 差异 的 结论 . 
Group Statistics 
T emo 37.7358 | 4304545 





z 0. 68 
















Independent Samples Test 
95% Confidence 


Levene's Test for 
Equality of Variances t-test for Equality of Means 
Interval of the 


Mean Std. Error Difference 











ig. Sig. (2-tailed) | Difference Difference 
Equal variances 
assumed . 0.500 14 68852 21.46024 |-29.50968 | 58 88672 
Equal variances 
not assumed 0.521 14.68852 22.46350 |-32 48433 | 61.86138 


图 8.15 例 8.14 的 SPSS 输出 
回顾 7. 5 节 当 方差 相同 的 假定 不 成 立时 , 依然 可 以 使 用 关于 (jw -pw ) 的 小 样本 推断 方法 . 用 7.5 


节 介 绍 的 ol = o2 的 两 种 情况 : n, = n, HE n, n, 对 (ji -jp ) 近 似 小 样本 检验 所 要 求 的 修正 来 结束 
这 一 节 . 
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3 io; 时 , 关于 (je: -jp ) 的 小 样本 检验 : 独立 样本 的 修正 


n =n, =n 














B 








检验 统计 量 ; 
t= (n -») -D, O - x ) -Do 
A. Len 
n n, n 
自由 度 : v=n +m, -2=2(n-1) 
n, n, 
检验 统计 量 ， 
10 73) -D 
S05 
n m 
_ (s/n, +s; /n,)° 
A. [Se (s) 
+ 
n, -1 n,-1 
Bi 通常 情况 下 CREAN EATA B. 7) 向 下 取 整 到 最 接近 的 整数 . 
应 用 练习 
8.31 生物 完整 性 指数 . 参考 练习 7.36,， Journal of 


œ 


Agricultural, Biological, and Environmental Sciences 
(2005 年 6 月 ) 关 于 生物 完整 性 指数 (1BI) 研究 . — 
个 水 栖 地 域 的 生物 环境 或 健康 状况 由 IBI 来 度量 ， 
位 于 俄 交 俄 两 个 流域 马 斯 京 根 和 霍金 的 IBI 数 据 列 
于 下 表 . 对 比较 两 个 流域 IBI 均值 的 假设 进行 检验 
(a=0.10), 并 解释 为 何 结论 与 练习 7. 36 中 基于 
90 色 置信 区 间 得 出 的 结论 是 -- 致 





流域 样本 容量 均值 L3 
马 斯 京 根 53 0.035 1.046 
霍金 51 0. 340 0. 960 


资料 来 源 : Boone, E. L. , Keying, Y. , and Smith, E. P. 
"Evaluating the relationship between ecological and habitat 
conditions using hierarchical models. ” Journal of Agricultur- 
al, Biological, and Environmental Sciences, Vol. 10, No. 2, 


June 2005 ( € 1). 


.32 研发 队伍 的 成 绩 . 在 美国 国防 部 , 独立 完成 同 


一 个 项 目的 研发 队伍 之 间 的 竞争 是 否 有 助 于 提高 
成 绩 ? 为 了 回答 这 个 问题 , 分别 对 58 个 研发 多 源 
(竞争 的 ) 合 同和 63 个 研发 单 源 合同 进行 了 成 绩 等 


2 VE fft (IEEE Transactions on Engineering Manage- 

ment, 1990 年 2 H). 在 报告 和 产品 的 质量 方面 , 有 

竞争 的 合同 成 绩 等 级 均值 是 7.62, 而 单 源 合 同 的 

均值 是 6. 95. 

a， 对 确定 有 竞争 的 研发 合同 的 平均 质量 成 绩 等 级 
超过 单 源 合同 的 平均 成 绩 建立 原 假设 和 备 择 
假设 . 

b. 计算 a = 0. 05 时 检验 的 拒绝 域 

c 检验 的 p 值 报告 在 0.02 ~ 0.03 之 间 , 那么 合 i 
的 结论 是 什么 ? 


.33 燃气 轮机 的 冷却 方法 . 参考 练习 &. 17, Journal 


of Engineering for Gas Turbines and Power(2005 年 1 

月 ) 关 于 燃气 轮机 通过 高 压 雾 状 入 风 冷 却 的 研究 . 

研究 者 把 燃气 轮机 分 为 三 类 : 传统 的 、 高 级 的 和 航 

改 燃气 轮机 . 下 面 的 MINITAB 输出 给 出 了 三 种 类 

型 燃气 轮机 样本 热 消 耗 率 (kJ/kW - h) 的 概括 统 

计量 . 

a. 是否 有 充足 的 证 据 证 明 传统 加 压 燃气 轮机 与 航 
改 加 压 燃 气 轮机 的 热 消 耗 率 均值 存在 差异 ?用 
a =0. 05 进行 检验 . 

b. 是 否 有 充足 的 证 据 证 明 高 级 加 压 燃气 轮机 与 航 
改 加 压 燃气 轮机 的 热 消耗 率 均 信 存在 差异 ?用 
a =0. 05 进行 检验 . 
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Descriptive Statistics: HEATRATE 


Variable ENGINE N Mean StDev Minimum Maximum 
HEATRATE Advanced 21 9764 639 9105 11588 
Aeroderiv 7 12312 2652 8714 16243 
Traditional 39 11544 1279 10086 14796 








练习 8. 33 的 MINITAB 输出 结果 


8.34 生产 过 程 电压 读数 . 参考 练习 7. 40, 哈里 斯 公 


司 /佛罗里达 大 学 关于 两 个 地 方 生产 过 程 平 均 电压 
读数 的 比较 . 老 地 方 和 新 地 方 30 个 生产 运行 数据 
FF VOLTAGE 文件 中 . 下 面 再 次 给 出 分 析 的 SAS 
输出 . 计算 并 解释 比较 电压 表 读 数 均值 检验 的 p 
值 . 得 出 什么 结论 ”所 得 结论 是 否 与 练习 7.40 的 
结论 一 致 ? 


8.35 ”废水 处 理 研究 . Eological Engineering( 2004 年 2 


月 ) 对 漂浮 的 水 生 植物 处 理 牛 凑 废 水 的 潜力 进行 
了 研究 . 其 中 的 一 项 工作 是 16 份 经 处 理 的 废水 
样本 随机 地 分 为 两 组 , 一 半 样 本 养殖 控制 海藻， 
男 一 半 则 养殖 水 风 信 子 . 检测 每 个 水 样本 中 总 磷 





含量 的 增长 率 , 并 把 结果 记录 于 下 表 中 . 检验 这 
两 种 水 生 植物 的 平均 总 磷 含 量 增长 率 是 否 存在 
差异 . o =0. 05. 








控制 藻类 水 风 信 子 

水 样本 容量 8 8 
样本 均值 0.036 0.026 
标准 差 0. 008 0. 006 


_—— 
资料 来 源 ; Sooknah, R. , and Wilkie, A. “Nutrient removal 


by floating aquatic macrophytes cultured in anaerobically di- 
gested flushed dairy manure wastewater" Ecological Engineer- 


ing, Vol. 22, No. 1, Feb. 2004( ë 5). 





Sanple Statistics 


Group N 
NEH 30 
OLD 30 


Hypothesis Test 


Null hypothesis: 
ñlternative: 


If Variances fire 


Not Equal 


Lower Limit 


Upper Limit 


Mean Std. Dee Std. Error 
9.422333 0.4789 0.0874 
9.803657 0.54093 0.0988 

Mean 1 - Mean 2 = 0 

Mean 1 - Mean 2 ^= 0 

t statistic Df Pr >t 
-2.891 58 0.0054 
-2.891 57.16 0.0054 


902 Confidence Interval for the Difference between Two Means 


8. 36 











练习 8.34 的 SAS 输出 结果 


以 计算 机 为 媒介 的 通信 研究 . 以 计算 机 为 媒介 
通信 (CMC) 是 一 种 基于 即时 通信 、 电 子 邮 件 技术 
互动 交流 的 形式 . 曾 进行 过 这 样 一 项 研究 ， 比较 人 
们 通过 CMC 交流 和 面对面 (FTF) 交流 的 关系 亲密 
程度 . (Journal of Computer- Mediated Communication , 
2004 年 4 月 ) 参 与 调查 者 是 48 名 大 学 本 科 生 , 他 
们 被 随机 地 分 为 两 组 , 一 半 为 CMC 小 组 , 另 一 半 


为 FTF 小 组 . 每 个 组 有 要 求 局 组 成 员 之 间 进 行 交 流 
的 任务 , CMO 组 通过 即时 通信 软件 进行 “聊天 ”， 
而 FTF 组 则 安排 在 会 议 室 聊天 . 经 过 三 轮 不 同 的 对 
话 , 每 轮 对 话 后 对 每 个 参与 者 测量 了 感 兴趣 的 变 
量 ， 即 关系 亲密 得 分 ( 按 7 个 等 级 划分 ). 这 里 给 出 
了 第 一 轮 对 话 的 概括 统计 量 . 研究 者 假设 经 过 第 一 
轮 对 话 后 , CMC 组 成 员 的 亲密 关系 得 分 均值 低 于 


Co 


8. 
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FTF 组 的 亲密 关系 得 分 均值 . 在 a =0. 10 情况 下 ， 
检验 研究 假设 . 





CMC FTF 
参与 者 人 数 24 24 
样本 均值 3.54 3. 53 
标准 差 0. 49 0.38 


.37 RAPANA. Environmental Science & 


Technology( 1993 年 10 月 ) 报道 过 对 加 洲 圣 杰 昆 塔 
果园 使 用 杀 虫 剂 的 研究 . 在 喷洒 杀 虫 剂 最 多 的 时 
期 , 每 天 采集 并 分 析 果 园 空 气 样本 , 空气 样本 中 硫 
和 和 氧 的 含量 (ng/m ) 以 及 氧 / 硫 比值 都 列 于 下 表 . 
利用 假设 检验 比较 果园 中 有 和 雾 天 气 和 晴 ( 或 多 云 ) 
天 气 时 的 氧 / 硫 的 平均 比值 . a =0. 05. 








日 期 环境 硫 氧 氧 / 硫 比 
1 月 15 日 E 38.2 10.3 0.270 
H 雾 28.6 6.9 0.241 
18 日 X 30.2 6.2 0.205 
DH 雾 23.7 12.4 0.523 
20H # 62. 3( 空 气 样本 丢失 ) - 
20 日 H 74.1 45.8 0.618 
2H * 88.2 9.9 0. 112 
AH H 46. 4 27.4 0.591 
2H # 135.9 44.8 0.330 
3H X 102. 9 27.8 0. 270 
22H £x 28.9 6.5 0. 225 
25H * 46.9 11.2 0. 239 
25H 晴 44.3 16.6 0. 375 





资料 来 源 : Selber, J. N. , et al. “Air and fog deposition residues 
of four organophosphate insecticides used on dormant orchards in 
the San Joaquin Valley, Califomia. " Environmental Science & 
Technology, Vol. 27, No. 10, Oct. 1993, p. 2240( 3 V). 


38 ARKET. 计算 机 用 户 友好 界面 的 一 个 特 
征 是 采用 亚 式 菜单 显示 方式 . 每 次 选择 一 个 菜单 
项 , 子 菜单 便 会 显示 出 来 , 并 且 部 分 地 履 盖 原 菜 
单 , 形成 一 系列 登 式 菜单 Special Interest Group on 
Computer Human Interaction Bulletin(1993 年 7 J ) 38 


8.8 检验 两 个 总 体 均值 的 差 : 配对 


Co 


告 了 有 无 合式 菜单 结构 对 搜索 时 间 影 响 的 分 析 . 将 
22 个 被 调查 者 随机 分 为 两 组 , 要 求 每 个 人 查找 菜 
单 驱动 软件 包 的 一 个 指定 项 目 . 在 试验 组 (mm = 11) 

用 又 式 菜单 格式 , 在 控制 组 (n, =11) 只 显示 当前 

菜单 . 

a. 研究 者 最 初 的 假定 是 , 对 两 种 不 同 的 菜单 显示 ， 
查找 目标 项 目 需要 的 平均 时 间 没 有 差异 . 描述 
检验 这 个 假设 合适 的 统计 方法 . 

b. 为 使 由 分 析 导 出 的 推断 有 效 需 要 满足 什么 假定 ? 

c. 两 组 的 平均 查找 时 间 分 别 为 11.02 s 和 11. 07 s. 
为 进行 检验 , 这 些 信 息 是 否 足够 ? 为 什么 ? 

d. 对 a 的 检验 , 观测 的 显著 性 水 平 超过 了 0. 10. f 
释 这 一 结果 . 


. 399 自动 化 问题 的 理解 . 流行 的 管理 行为 模式 认 


为 ， 一 个 制造 企业 的 自动 化 现状 影响 管理 者 自动 
化 问题 的 理解 . 为 了 研究 这 个 问题 , 肯 考 迪 娅 大 学 
(蒙特 利 尔 ) 的 研究 者 分 别 对 具有 高 、 低 自动 化 水 
平 企 业 的 管理 者 进行 了 调查 (7PEEBE Transactions on 
Engineering Management, 1990 年 8 H), 要 求 每 个 
管理 者 给 出 自己 对 企业 自动 化 问题 的 理解 ,回答 
按 5 分 度量 (1: 没有 问题 ,，…, 5; 严重 问题 ). 两 
组 管理 者 回答 的 概括 统计 量 列 于 下 表 , 由 此 检验 
高 、 低 自动 化 水 平 企 业 的 管理 者 对 自动 化 问题 理 








解 的 平均 水 平 没 有 差异 的 假设 . 
样本 容量 均 值 标准 差 
低 水 平 17 3.274 0.762 
高 水 平 8 3. 280 0. 721 


资料 来 源 : Farhoomand, A. F. , Kira D. , and Williams, J. 
" Managers ’ perceptions towards automation in manufactur- 
ing." IEEE Transactions on. Engineering Management, Vol. 
37, No. 3, Aug, 1990, p. 230. 


a. 假定 两 组 管理 者 的 理解 方差 相等 ， 进 行 假设 检 
验 . a =0.01. 

b 如果 已 经 知道 低 水 平 与 高 水 平 企业 的 管理 者 的 
理解 方差 不 等 ,进行 假设 检验 . a =0. 01. 


利用 配对 收集 的 数据 可 能 比 独立 样本 得 到 两 个 总 体 的 均值 差 的 更 多 信息 . 例如 ， 要 做 一 个 试验 
来 研究 人 工 降雨 过 程 中 云 的 催化 效力 . 首先 ， 选择 两 个 过 去 气象 记录 相似 的 耕作 地 区 , 一 个 地 区 进 
行 催化 , 而 另 一 个 则 保持 原状 . 记录 随机 选取 6 个 月 的 月 降水 量 , 根据 记录 的 按 月 配对 数据 可 以 检验 
进行 催化 和 未 催化 地 区 平均 月 降水 量 是 否 存在 差异 . 采用 的 方法 总 结 在 下 面 的 框 格 中 . 
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(m -Kz) 的 大 样本 假设 检验 ; 配对 


单 侧 检 验 双 侧 检验 
Hs: (m =u) = D, H,: t - u) = D. 
H,: (m =m) >D, H,: (ji - i5) D, 


[或 者 已 : (jp -m) <Da] 
d-D, d-D, 
ovn s/n 
其 中 4d 和 ss 表示 差 的 样本 均值 和 标准 差 
拒绝 域 : Z >z,[ 或 者 Z < -z ] 拒绝 域 : |Z] >z 
CÈ: D, 表示 H, 中 指定 的 (jw -如 ) 值 . 在 许多 应 用 中 ， 我 们 想 假 设 两 个 总 体 的 均值 不 存在 差异 , 在 这 
种 情况 下 ,Du =0. ) 


检验 统计 量 : Z= 











(m, -pz ) 的 小 样本 假设 检验 : 配对 


单 侧 检验 双 侧 检验 
Hy: us -J ) =D, Hy: Qu -H.) =D, 
H,: (p — n) > D, H,: (p ~u) # D, 


[R# H,: (m -po) < D. ] 
d-D, d-D, 
ovn sn 

其 中 4d 和 s, 表示 差 的 样本 均值 和 标准 差 . 

拒绝 域 : 了 >t[ 或 者 T< i] EAR: | T | >t 

其 中 了 分 布 的 自由 度 为 (n -1). 

GE: D, 表示 原 假设 中 指定 的 (jw -pr ) 值 . 在 许多 应 用 中 ， 我 们 想 假设 两 个 总 体 的 均值 不 存在 差异 ,在 
这 种 情况 下 ,Du =0. ) 

假定 : 1. 差 的 总 体 相对 频率 分 布 是 近似 正 态 的 . 

2. 配对 差 是 从 差 的 总 体 中 随机 选取 的 . 

警告 : 当 正 态 性 假定 严重 违反 时 ， i 检验 可 能 导致 错误 的 推断 . 这 种 情况 下 ,采用 将 在 15.4 节 介绍 的 非 

参数 Wilcoxon 检验 . 


检验 统计 量 : T = 

















考虑 人 工 降 雨 试验 比较 两 个 耕作 地 区 的 月 降水 量 . 表 8. 5 中 的 数据 能 提供 充分 的 证 据 证 
明 经 过 催化 地 区 的 平均 月 降水 量 大 于 未 进行 催化 地 区 吗 ? 利用 a =0.05 检验 . 
表 8.5 例 8.15 月 降水 量 数据 (in) 


耕作 地 区 1 2 3 4 5 6 
催化 1.75 2.12 1.53 1.10 1.70 2.42 
未 催化 1. 62 1. 83 1.40 0.75 1.71 2.33 


d 0.13 0.29 0.13 0.35 — 0.01 0. 09 


解 设 和 jz 分 别 表示 经 过 催化 和 未 催化 耕作 地 区 平均 月 降水 量 . h FREM u >u, 因此 
进行 单 侧 检 验 : 


二 
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Ho: (mı -AM ) =0 
H,: (mı - u2) >0 
假定 两 个 地 区 的 月 降水 量 差 近似 服从 正 态 分布 , 那么 检验 统计 量 服从 自由 度 为 (2 - 1) = (6-1) 55 
的 了 分 布 . 如 果 fo) 
T>io os 22.015 ( 见 图 8.16) 
我 们 将 拒绝 原 假设 . 
为 了 手 算 该 检验 , 首先 必须 计算 两 个 地 
区 每 个 月 降水 量 的 差 d. 这 些 差 (每 对 数据 中 
用 催化 耕作 区 的 观测 值 减 去 未 催化 耕作 区 的 
观测 值 ) 见 表 8.5 的 最 后 一 行 . 然后 需要 计 





自由 度 为 5 的 了 分 布 











9 n =6 个 差 的 样本 均值 4 和 标准 差 ye， 从 0 | 
而 得 到 检验 统计 量 . toos = 2.015 | 拒绝 Ho 

如 果 不 这 样 计算 , 还 可 以 依赖 于 计算 机 现 测 到 的 检验 统计 量 的 信 
的 输出 ， 上 述 分 析 的 MINITAB 输出 见 图 图 8.16 {8.15 的 拒绝 域 


8.17. 图 8. 17 阴影 部 分 的 检验 统计 量 为 了 =3.01. 





Paired T for SEEDED - UNSEEDED 


N Mean StDev SE Mean 
SEEDED 6 1.77000 0.45974 0.18769 
UNSEEDED 6 1.60667 0.52164 0.21296 
Difference 6 0.163333 0.133066 0.054324 


95% lower bound for mean difference: 0.053868 
T-Test of mean difference = 0 (vs > 0): T-Value = 3.01. P-Value = 0.015 








图 8.17 例 8.15 的 MINITAB 输出 


由 于 检验 统计 量 的 这 个 值 超过 了 临界 值 os =2. 015, 因此 有 充足 的 证 据 (在 w =0.05) 证 明 经 催 
化 寿 作 区 平均 月 降水 量 大 于 未 经 催化 耕作 区 . 

检查 检验 的 p 值 也 可 以 得 出 相同 的 结论 . MINITAB 输出 中 阴影 部 分 给 出 了 单 侧 检验 的 p 值 等 于 
0.015. 由 于 该 值 小 于 选 定 的 oc 7K3 (0.05) , 因此 我 们 拒绝 Ho. 实际 上 , 对 大 于 p 值 =0.015 的 任意 
a, 我 们 都 将 拒绝 Ho. 

在 例 8. 15 的 试验 中 , 我 们 为 何 要 收集 成 对 样本 的 数据 , 而 不 是 独立 随机 地 选取 经 催化 地 区 几 个 
月 的 数据 和 未 经 催化 地 区 另外 几 个 月 的 数据 . 原因 在 于 某 些 月 份 的 降水 量 较 其 他 月 份 要 多 . 为 了 消 
除 月 份 之 间 的 变异 性 , 试验 应 设计 为 两 个 地 区 的 相同 月 份 降水 量 作 为 样本 . 在 给 定 的 月 份 , 两 个 地 
区 处 于 相同 的 季节 状况 . 比较 每 个 月 降水 量 , 比 起 独立 随机 样本 , 能 得 到 关于 平均 月 降水 量 差 的 更 
多 信息 . 


应 用 练习 对 面 交流 (FIF) 的 亲密 程度 比较 研究 . 经 过 三 轮 不 
ei. MN 同 的 交谈 ,每 轮 过 后 评价 每 个 参与 者 的 亲密 程度 
8.40 以 计算 机 为 媒介 的 通信 研究 参考 练习 8.36， 得 分 ( 按 7 个 等 级 划分 ). 研究 者 又 假设 CMC 组 成 


Journal of Computer- Mediated Communication (2004 员 的 第 三 轮 亲 密 关 系 程度 均值 显著 地 大 于 第 一 轮 
年 4 月 ) 关 于 人 们 通过 计算 机 媒介 通信 (CMC) 和 面 的 均值 . 而 对 于 FTF 组 成 员 , 第 一 轮 和 第 三 轮 之 间 
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的 差别 并 无 明显 变化 . i. 利用 @=0.01. 

a XJF CMC 组 的 比较 , 给 出 感 兴趣 的 原 假设 和 备 b. 利用 统计 软件 包 计 算 在 全 黑暗 和 短暂 光明 两 种 
择 假设 . 条 件 下 103 个 基因 的 标准 化 成 长 的 平均 差异 . a 


b. 研究 者 应 用 配对 的 :检验 来 进行 a 的 比较 , 解释 
用 配对 分 析 的 原因 . 

c. 对 于 CMC 组 的 比较 , 报告 的 检验 统计 量 为 ;= 
3.04, p =0.003. 对 结果 进行 解释 , 结果 是 否 支 


持 研究 者 的 假设 . 
d. 对 于 FTF 组 的 比较 , 给 出 感 兴趣 的 原 假设 和 备 
择 假设 . 


e. 对 于 FIF 组 的 比较 , 报告 的 检验 统计 量 为 1 = 
0.39, p =0.70. 对 结果 进行 解释 , 结果 是 否 支 持 
研究 者 的 假设 . 

.41 基因 的 明 瞳 转换 . 集 胞 藻 是 一 种 能 在 广泛 条 件 
下 生存 并 成 长 的 蓝 绿 菌 ,科学 家 用 来 建立 DNA f3 
为 的 模型 , 在 Journal of Bacteriology( 2002 年 7 月 ) 
中 , 科学 家 分 离 出 负责 光合 作用 和 呼吸 作用 的 细 
菌 基因 , 以 研究 基因 对 光 的 敏感 性 . 每 个 基因 样本 
在 “全 明 "” 的 培养 四 长 到 中 指数 期 时 , 关 掉 灯光 , 使 
之 处 于 "全 暗 ” 的 环境 中 . 24 h 后 , 测量 其 生长 状 
Bb. 然后 再 次 打开 灯 并 持续 照射 90 min ( 短暂 的 光 
明 ) ， 随 后 立即 再 处 于 全 暗 状态 90 min (短暂 的 黑 
HH). 得 到 了 103 个 基因 在 光明 /黑暗 条 件 下 标准 化 
成 长 测量 值 . 完整 的 数据 集合 保存 在 GENEDARK 
文件 . 下 表 给 出 前 10 个 基因 数据 . 








基因 标识 全 È 短暂 光明 ”短暂 黑暗 

SLR2067 -0.005 62 1. 40 989 -1.28 569 
SLR1986 _ 0. 68 372 1. 83 097 一 0. 68 723 
SSR3383 — 0. 25 468 _ 0. 79 794 —-0. 39 719 
SLL0928 -0. 18 712 - 1. 20 901 -1. 18 618 
SLR0335 -0. 20 620 1.71 404 -0. 73 029 
SLR1459 -0.53 477 2.14 156 -0.33 174 
SLL1326 —0. 06 291 1. 03 623 0. 30 392 
SLR1329 -0. 85 178 -0.21 490 0. 44 545 
SLLI327 0. 63 588 1. 42 608 _ 0. 13 664 
SLLI325 — 0. 69 866 1.93 104 —0. 24 820 


资料 来 源 : Gill, R. T., 
scriptional profiling of the light to dark transition in Synecho- 
cystis Sp. PCC6803. " Journal of Bacteriology, Vol. 184, No. 
13, July 2002. 


a. 将 前 10 个 基因 作为 从 103 个 基因 所 组 成 的 总 体 
中 选取 的 随机 样本 . 检验 在 全 黑暗 和 短暂 光明 
两 种 条 件 下 平均 标准 化 成 长 之 间 没 有 不 同 的 假 


et al. “ Genome-wide dynamic tran- 


œ 


的 检验 能 发 现 这 个 差异 吗 ? 

c. HEX a 和 b, 对 全 黑暗 和 短暂 黑暗 两 种 条 件 下 ， 
比较 基因 的 平均 标准 化 成 长 . 

d. 重复 a 和 b, 对 短暂 光明 和 短暂 黑暗 两 种 条 件 
下 ,比较 基因 的 平均 标准 化 成 长 . 


.42 检验 电子 线路 . 参考 练习 7.46, IEICE Transac- 


tions on Information. & Systems(2005 年 1 月 ) 关于 检验 
电子 电路 两 种 方法 的 比较 . 对 11 个 电路 分 别 应 用 两 种 
方法 进行 检测 ,一 种 是 标准 的 压缩 / 降 压 法 , 另 一 种 
是 新 的 赫 夫 曼 编 码 法 . 记录 压缩 比 , 数据 见 下 表 . 理论 
E, 替 夫 曼 编码 法 会 得 到 较 小 的 平均 压缩 比 . 

a. 在 a=0.05 F, 检验 该 理论 . 

b. 你 在 a 中 的 结论 是 否 与 练习 7. 46 H 95% Efe x 

间 得 到 的 结论 一 致 . 





# FB 标准 方法 BE S IDE 
1 0. 80 0. 78 
2 0. 80 0. 80 
3 0. 83 0. 86 
4 0. 53 0. 53 
5 0. 50 0.51 
6 0. 96 0. 68 
7 0. 99 0. 82 
8 0. 98 0. 72 
9 0.81 0. 45 
10 0. 95 0.79 
11 0. 99 0.77 


资料 来 源 : Ichihara, H. , Shintani M. 
" Huffman- based test response coding. " IEICE Transactions 
on Information & Systems, Vol. E88-D, No. 1, Jan. 2005 
(R3). 


, and Inoue, T. 


.43 混凝土 路 面 对 温 度 的 响应 . 西 弗吉尼亚 大 学 的 


土木 工程 师 开 发 了 一 个 3D 模型 来 预测 温度 变化 时 
接 颖 的 混凝土 路 面 的 响应 . ( The International Jour- 
nal of Pavement Engineering, 2004 年 9 H. ) 为 了 证 
实 这 个 模型 的 有 效 性 ， 把 某 新 建 公 路 的 关键 混 凝 
土 应 力 变 量 现场 测量 值 与 模型 的 预测 进行 了 比较 . 
测量 的 一 个 变量 就 是 距 纵 向 接 缝 一 米 处 混凝土 表 
面 的 横向 应 变 ( 即 每 单位 时 间 每 单位 长 度 的 长 度 恋 
fk). 对 6 天 的 5h( 晚 上 8:20 到 凌晨 1 :20) 混凝土 
表面 横向 应 变 变 化 数据 列 于 下 表 , 现场 测量 数据 
与 3D 模型 预测 数据 的 平均 日 横向 应 变 变化 是 否 存 
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在 显著 差异 . 利用 a =0. 05 检验 . 








横向 应 变 变化 

日 其 pond 现场 测量 值 。 3D 模型 
10 月 24 日 -6.3 -58 -52 
12 月 3 日 13.2 69 59 
12H15 日 3.3 35 32 
2H2H 一 14.8 一 32 -24 
3 H25 H 1.7 -40 -39 
5 H24H -0.2 - 83 -71 


资料 来 源 ; Shoukry, S. , William, G. , and Riad, M. “Val- 
idation of 3DFE model of jointed concrete pavement response 
to temperature variations. " The International Journal of Pave- 
ment Engineering, Vol. 5, No. 3, Sept. 2004 ( 表 IV). 


8.44 机 器 人 实时 调度 . 普 渡 大 学 的 研究 者 进行 了 一 
项 对 比 研究 , 在 某 种 作业 环境 下 比较 人 工 实 时 调 
度 和 利用 计算 机 化 机 器 人 和 传感器 装置 的 自动 化 
实时 调度 (IEEE Transactions, 1993 年 3 H). 试验 
包括 8 个 模拟 的 调度 问题 , 分 别 由 人 工 和 自动 化 系 
统 来 完成 . 完成 的 好 坏 由 生产 能 力 率 来 检验 , 生产 
能 力 率 定义 为 以 产品 质量 为 权 的 有 效 工 作 数量 . 试 
验 结果 见 下 表 , 利用 假设 检验 进行 数据 分 析 . 





f£ 5 人 工 调度 自动 方法 
1 185.4 180.4 
2 146.3 248.5 
3 174.4 185.5 
4 184.9 216.4 
5 240.0 269.3 
6 253.8 249.6 
7 238.8 282. 0 
8 263. 5 315. 9 





资料 来 源 ; Yih, Y. , Liang, T. , and Moskowitz, H. “Robot 
scheduling in a circuit board production line; A hybrid OR/ANN 
approach. " IEEE Transactions, Vol. 25, No. 2, March 1993, p. 31 
GR D. 


8.45 TERRES. 默 克 研 究 实 验 室 利用 T 型 游泳 迷 


宫 做 一 项 试验 来 评估 新 药 的 作用 . 捕捉 了 19 只 怀孕 的 
大 坝 老鼠 ,每 只 注射 12. 5 mg 剂量 的 药品 . 然后 , 从 每 
窝 幼 仔 中 随机 选取 一 只 公仔 和 一 只 母 仔 进行 游泳 迷宫 
试验 . 把 每 个 幼 鼠 放 在 水 中 迷宫 的 一 端 , 让 其 自由 游 
动 , 直到 它 成 功 逃 至 迷宫 的 另 一 端 . 如 果 幼 鼠 未 能 在 
规定 的 时 间 里 成 功 逃 跑 , 它 将 被 放置 在 迷宫 的 开始 


œ 


端 , 再 次 让 它 逃 跑 . 反复 进行 试验 , 直至 每 只 幼 鼠 成 
功 完成 逃跑 三 次 为 止 . 下 表 数 据 代 表 每 只 幼 鼠 完成 三 
次 成 功 逃 跑 所 需 试验 的 次 数 . 是 否 有 充分 证 据 表明 公 
仔 和 母 仔 的 平均 试验 次 数 存在 差异 ? 


Wo 公仔 母 仔 | X 








公仔 SUY 

1 8 5 11 6 5 
2 8 4 12 6 3 
3 6 7 13 12 5 
4 6 3 14 3 8 
5 6 5 15 3 4 
6 6 3 16 8 12 
7 3 8 17 3 6 
8 5 10 18 6 4 
9 4 4 19 9 5 
10 4 4 





资料 来 源 : Bradstreet, Thomas E. Merek Research Labs, BL 
3-2, West Point, PA 19486. 


S46 — 35 ik. 二 恶 英 是 在 工业 废水 中 发 现 的 剧 


毒物 质 . 进行 一 项 研究 以 测定 牛蛙 组 织 中 二 恶 英 的 
含量 , 这 种 牛蛙 生活 在 中 部 阿肯色 州 的 落 基 支脉 
小 溪 , 一 个 已 知 被 TCDD 污染 的 地 方 ( Chemosphere , 
1986 ££ 2 H). 选取 了 4 只 上 肉 性 牛蛙 , 检测 几 个 组 
织 中 二 恶 英 含量 (万 亿 分 之 一 ) 并 对 每 只 牛蛙 记录 
组 织 中 二 恶 英 含 量 与 腿 部 肌肉 中 二 恶 英 含量 的 比 
值 . 下 表 给 出 了 肝脏 和 卵巢 两 个 组 织 污染 物 含量 的 
相对 比 . 研究 者 认为 “从 数据 可 以 看 出 雌性 牛蛙 卵 
梨 中 二 恶 英 的 (平均 ) 相 对 水 平 高 于 肝脏 的 (平均 ) 
水 平 .” 利 用 a =0. 05 检验 这 种 观点 . 


f: A B C D 
肝脏 11.0 14.6 14.3 12.2 
EES 34.2 41.2 32.5 26.2 


资料 来 源 : Korfmacher, W. A. , Hansen, E. B. , and Row- 
land, K. L. “Tissue distribution of 2, 3 , 7, 8-TCDD in bull- 
frogs obtained from a 2, 3, 7, 8- TCDD- contaminated area. " 
Chemosphere, Vol. 15. No. 2, Feb. 1986, p. 125. Reprin- 
ted with permission. Copyright 1986, Pergamon Press, Ltd. 


.47 气体 的 运输 模型 . 在 AIChE Journal (2005 4£ 1 


月 ) 中 , 化 学 工程 师 公布 了 一 种 建立 多 成 分 气体 运 
输 模型 的 新 方法 . 备 制 了 12 份 氛 、 氨 和 氨 按 照 不 
同比 例 、 不 同 温度 的 混合 气体 . 用 实验 检测 每 份 混 
合 气体 的 粘性 (单位 : 107 Pa + s) 并 用 新 模型 计 
算 , 结果 列 于 下 表 . 化 学 工程 师 断 言 “ 新 计算 结果 
与 试验 高 度 一 致 ,” 你 同意 这 种 观点 吗 ? 你 的 回答 
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应 包括 从 实际 与 统计 显著 性 的 讨论 . ( 续 ) 
混合 气体 混合 气体 — 
实验 新 方法 实验 新 方法 
1 2.740 2.736 9 3. 790 3. 792 
2 2. 569 2.575 10 3. 574 3.582 
3 24H 2. 432 11 3.415 3.439 
4 2. 504 2.512 
5 3.237 3.233 12 3. 470 3. 476 
6 3. 044 3. 050 资料 来 源 : Kerkhof, P. , and Geboers, M. “Toward a unified 
7 2. 886 2. 910 theory of isotropic molecular transport phenomena. " AIChE 
8 2.957 2. 965 


Journal, Vol. 51, No. 1, January 2005( 322). 





8.9 检验 总 体 比率 


在 8.2 节 中 , 给 出 了 几 个 总 体 比率 p 的 假设 统计 检验 例子 . 当 样本 容量 足够 大 时 , 样本 的 成 功 比 
率 p 近似 服从 正 态 分 布 , 并 可 应 用 大 样本 z 检验 (在 8.2 节 中 给 出 ) 的 一般 公式 . 

下 面 给 出 了 比率 p 的 基于 来 自 目标 总 体 的 大 样本 总 体 假设 检验 步骤 . (回忆 p 表示 二 项 试验 中 成 
功 的 概率 . ) 这 种 方法 要 求 样本 容量 必须 足够 大 , 保证 样本 比率 $ 的 抽样 分 布 的 近似 正 态 性 . 和 置信 
区 间 一 样 , 判定 是 耕 足 够 大 的 一 般 经 验 法 则 是 nb 和 ng 都 要 大 于 等 于 4. 











总 体 比率 假设 的 大 样本 检验 

单 侧 检 验 双 侧 检验 
H: p=po Ho: p=po 
H,: p>po [或 者 HH: p<po] H,: pzpo 

检验 统计 量 : z- 

~ Podo/ 
其 中 , qo =1 -Po 
拒绝 域 : Z>z。 [或 者 Z< -z] 拒绝 域 : | Z | >z 
假定 : 样本 容量 nn 足够 大 以 保证 近似 是 有 效 的 . 作为 4 EXHI S np>4 E n4>4 时， 条 件 “ 足 够 大 ” 
A. 





会 路 桥梁 建设 中 使 用 耐候 钢 引起 了 很 大 的 争议 . 批评 者 最 近 列举 耐候 钢 严 重 腐蚀 问题 ， 
并 且 强 烈 要 求 政府 禁止 这 种 钢 在 建 桥 中 的 使 用 . 另 一 方面 , 钢 厂 则 声称 这 些 控诉 过 于 夸张 ,并 日报 
告 所 有 使 用 中 的 耐候 钢 桥 95% 性 能 “良好 ”, 没有 重大 的 腐蚀 损坏 . 为 了 检验 这 种 说 法 , 由 工程 师 和 
钢铁 业 专家 组 成 的 研究 小 组 ， 随 机 选取 了 60 座 耐 候 钢 桥梁 进行 评估 ， 其 中 有 54 座 性 能 “良好 ”. 在 
a=0.05, 是 否 有 证 据 证 明 耐 候 钢 公路 桥 中 保持 性 能 "良好 ”的 实际 比率 低 于 钢铁 厂 指出 的 95% 
解 ” 感 兴趣 的 参数 是 总 体 比率 p, 因此 检验 
Ho: p=0.95 
H,: p <0. 95 
其 中 p 表示 所 有 耐候 钢 公 路 桥 中 保持 性 能 “良好 ”的 真实 比率 . 
在 显著 性 水 平 a =0.05, € 
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B 
oo 
b 





Z« — £0.05 


则 拒绝 原 假 设 . 也 就 是 说 , # 


Z < -1.645 


H; 将 被 拒绝 . 
保持 性 能 “良好 ”公路 桥 的 样本 比率 是 : 
p5 =0. 90 
因此 , 检验 统计 量 的 值 为 : 
_P-po _ 0.90-0.95 5g 
pogon ((0.95)(0.05)760 
由 于 计算 的 z 值 落 人 拒绝 域 ， 原 假设 被 拒 
绝 (a 20.05). 所 以 有 充足 的 证 据 表明 耐候 钢 公 
路 桥 中 保持 性 能 “良好 ”的 比率 低 于 0.95. C: 
np =60(0.90) =54, nj =60(0.10) =6 均 大 于 








( 见 图 8. 18) 
fe) 











0 
1.645 


观测 到 的 检验 统计 量 的 值 
Z = 一 1.78 


图 8.18 例 8.16 的 拒绝 域 








— FEH Ho Zoos 


4. 因此 样本 容量 显然 足够 大 , 可 以 保证 假设 检验 的 有 效 性 . ) 
虽然 检验 总 体 比率 假设 的 小 样本 方法 是 可 用 的 , 但 是 细节 在 这 里 不 做 讨论 . 根据 我 们 的 经 验 , 实际 
中 执行 的 大 多 数 二 项 总 体 的 调查 (如 民意 测验 ) 样 本 都 是 足够 大 的 , 可 以 使 用 本 节 介 绍 的 方法 . 


应 用 练习 

8.48 ”计算 机 越权 使 用 . 计算 机 安全 研究 所 ( CSI) 曾 

进行 过 一 项 计算 机 犯罪 的 调查 . 在 163 个 报告 商业 

网 址 越权 使 用 的 案例 样本 中 有 7 个 来 自 于 公司 内 

部 . (Computer Security Issues & Trends, Vol. 7, 2001 

年 春 . ) S p 表示 2001 年 越权 使 用 商业 网 址 来 自 公 

司 内 部 的 真实 比率 . 

a. 计算 p 的 点 估计 值 . 

b. 对 检验 p 值 是 否 不 等 于 0. 07 建立 原 假 设 和 备 择 

e. 计算 b 中 检验 的 检验 统计 量 . 

d. 340 20.05 时 , 计算 此 检验 的 拒绝 域 . 

e. JB ct d 的 结果 , 给 出 适当 的 结论 . 

f. 计算 检验 的 p 值 , 确认 根据 p 值得 到 的 结论 与 e 
的 结论 一 致 . 

49 有 毒化 学 事件 . 参考 练习 3. 1 Process Safety 

Progress( 2004 年 9 月 ) 关 于 中 国 台湾 地 区 有 毒化 

学 事件 紧急 响应 系统 的 研究 . 自从 这 个 系统 开始 

实施 后 , 记录 了 250 起 有 毒化 学 事件 , 其 中 有 

15 起 发 生 于 学 校 的 实验 室 . 假定 你 想 对 中 国 台 

湾 地 区 的 有 毒化 学 事件 进行 假设 检验 , 确定 发 

生 在 学 校 实验 室 有 毒化 学 事件 的 比率 是 否 低 

+ 1096. 

a、 建 立 检验 的 原 假 设 和 备 择 假设 . 


eo 


b. "4a 20.01 时 , 确定 拒绝 域 . 

e. 计算 检验 统计 量 的 值 . 

d. 给 出 此 检验 合适 的 结论 . 

50 低 氧 杀 忠 . 澳大利亚 的 昆虫 毒物 学 家 们 研究 了 

暴露 于 低 氧 对 昆虫 死亡 率 的 影响 (Journal of Agri- 

cultural, Biological, and Environmental Statistics, 

2000 4E 9 H. ) 在 一 间 放 有 小 麦 等 谷物 的 房间 里 放 

置 数 千 只 稻 象 鼻 虫 成 虫 , 然后 将 房间 暴露 于 氮气 4 

R. 检查 这 些小 虫 暴 露 后 是 否 存 活 24 h. 检查 结果 : 

31386 只 称 象 鼻 虫 死亡 , 35 只 还 存活 . 以 前 的 研究 

表明 , 稻 象 鼻 虫 暴露 于 二 氧化 碳 4 天 的 死亡 率 为 

99% . 那么 暴露 于 氮气 的 稻 象 鼻 虫 死亡 率 是 否 高 于 

99%? oa =0. 10. 

8.51 送 纸 过 程 中 的 摩擦 力 . 罗切斯特 大 学 的 学 者 研 
究 了 影印 机 送 纸 过 程 中 的 摩擦 力 ( Journal of Engi- 
neering for Industry, 1993 年 5 月 ). 实验 对 进入 影印 
机 的 每 一 张 纸 的 移动 进行 了 监测 . 如 果 除 了 最 上 面 
的 一 张 以 外 , 没有 一 张 纸 移动 超过 总 行程 距离 的 
2596 , 那么 就 认为 这 一 送 纸 过 程 是 成 功 的 . 在 一 又 
100 张 的 纸 中 , 有 94 次 送 纸 是 成 功 的 . 供 纸 器 成 功 
率 设计 值 为 0. 90. 检验 该 供 纸 器 的 实际 成 功率 是 否 
超过 0. 90. 利用 a =0. 10. 

8.52 工程 学 博士 . 国家 科学 基金 会 调查 了 2 237 位 
刚 取 得 博士 学 位 的 毕业 生 , 其 中 有 607 位 是 美国 公 


eo 
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R, 而 大 多 数 (1 630 位 ) 博 士 学 位 授 给 了 其 他 国籍 
BJ À (Science, 9. 24, 1993). 检验 工程 学 博士 授予 
其 他 国籍 的 人 的 比率 是 否 超过 了 0.5. 利用 
a =0. 01. 

8.53 司机 使 用 手机 . $5252] 7.52, 关于 美国 交通 
部 对 司机 在 驾驶 客运 车 辆 中 使 用 手机 的 水 平 研 究 
(2001 年 7 月 ). 在 全 国 范围 内 随机 选取 了 1 165 个 
司机 作为 一 个 样本 , 其 中 有 35 个 正在 使 用 手机 . 

a. 检验 司机 的 手机 使 用 真实 比率 p 是 否 等 于 0.02? 
a =0. 05. 

b. fr a 的 结论 是 否 与 练习 7.52 中 利用 p 的 95% 置 
信和 区间 得 到 的 结论 一 致 ? 

8.54 月 球 土壤 研究 . Meteoritics(1995 年 3 月 ) 报 
告 了 一 项 月 球 土壤 演化 的 研究 结果 . 数据 是 从 阿 
波 罗 16 号 奔赴 月 球 时 得 到 的 , 在 着 陆地 点 附近 
的 土壤 中 选取 了 一 个 62 cm 的 岩心 . 把 月 球 土 壤 
的 单 矿 物 颗粒 分 开 , 并 检查 它们 是 否 被 尘土 和 
火山 玻璃 碎片 包 壳 , 每 一 个 颗粒 划分 为 包 壳 的 和 
未 包 壳 的 两 种 . 我 们 所 关心 的 是 “ 包 壳 率 ”, 也 就 
是 颗粒 被 包 壳 的 比率 . 根据 土壤 演变 理论 , u 
率 大 于 0. 5 在 岩心 顶部 , 等 于 0. 5 在 岩心 中 部 ， 
低 于 0. 5 在 岩心 底部 . 利用 下 表 中 的 数据 检验 这 


8.10 ”检验 两 个 总 体 比 率 的 差 








一 理论 . a =0. 05. 
位 置 (深度 ) 
顶部 中 部 底部 
(4.25cm)  (28.1em) (54.5 cm) 
抽样 的 颗粒 数量 84 73 81 
包 壳 数量 64 35 29 
资料 来 源 : Basu, A. , and Mckay, D. S. “Lunar soil evolu- 


tion processes and Apollo 16 core 60013/60014. ” Meteoritics , 
Vol. 30, No. 2, Mar. 1995, p. 166(3€ 2). 


eo 


55 人 类 对 野生 动物 的 干扰 . 计划 在 不 列 颠 哥 伦 比 
亚 的 斯 蒂 金 河 进 行 一 项 水 力 电 气 设计 ,研究 人 员 
初步 调查 了 人 类 干扰 对 于 在 此 生活 的 野生 白山 羊 
总 体 的 影响 ,以 此 作为 该 设计 的 环境 影响 报告 评 
佑 的 一 部 分 ( Environmental Management, 1983 年 3 
H). 对 804 只 山羊 记录 了 它们 对 探测 活动 的 反应 ， 
包括 低空 飞行 的 直升机 、 固 定 翼 飞机 、 人 类 的 行 
E, 以 及 地 质 钻探 活动 发 出 的 巨 响 . 研究 者 发 现 其 
中 265 只 山羊 对 于 附近 震动 或 者 飞机 的 反应 是 剧 
烈 的 逃跑 . 检验 有 超过 30% 野生 白山 羊 对 于 人 类 干 
扰 的 反应 是 剧烈 逃跑 的 假设 , 利用 a =0. 05. 


对 于 大 样本 情况 下 ,两 个 二 项 比率 差 (p1 - p) 的 假设 检验 方法 列 于 下 面 的 框 格 中 . 





单 侧 检 验 

Hy: (pi - p) =D, 
H,e:(p-p) >D, (或 者 HH: (pı - p) < Do) 
(Pı -b;) - D, 


9 (6, 


检验 统计 量 : Z= 


-b2) 
拒绝 域 : Z >z. 
当 Do 关 0 时 ， 


(或 者 Z< -z,) 





其 中 和 =1 pi， d; =1 -b,. 
3 D, =0 时 ， 





(P, -p.) 假设 的 大 样本 检验 :; 独立 样本 


双 侧 检验 
Hy: (p. -pz) = D, 
H,: (p, - p.) # D, 


拒绝 域 : | 2 | >z, 
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其 中 联合 样本 中 成 功 的 总 次 数 为 (yi +y), H 


假定 ; 样本 容量 n, fu n, 足够 大 . Æ mp z4, nq, z4 H npa z4, TA z4 WEE. 








当 检验 (Pi ~ ps) 等 于 某 个 特定 值 (如 Do) 的 原 假设 时 , 我 们 要 区 别 Do =0 和 D, =0 两 种 情况 . 对 
于 Do =0 的 情况 , BRE Ho: (p, -ps) =0 或 等 价 地 Ho: pi =p 时 , 用 联合 样本 的 成 功 总 数 除 以 两 
个 样本 总 观测 值 个 数 是 =p: =p 的 最 好 估计 . 也 就 是 说 , 如 果 y, 表示 样本 1 中 成 功 次 数 , y, 表示 
样本 2 中 成 功 次 数 , 那么 

np n3 


在 这 种 情况 下 ，( 户 — Pa) 抽样 分 布 标准 差 的 最 好 估计 可 用 户 代 替 p, 和 p, 而 得 


pidi 4222 q JH ipa 1 
9 (b - p.) SES n Je d ty) 


对 于 所 有 Do #0 情况 (例如 , 检验 Ho: Q -pi) 20.2), RITH Tü p. 来 计算 oG, is. 然而 
在 多 数 实际 情况 下 , 我 们 想 检验 两 个 比率 之 间 是 否 存在 差异 , 即 想 检 验 Ho: (p-p) =0. 

样本 容量 n, 和 n 必须 足够 大 , 为 了 保证 如 fl po, KeA (p, - pa) 的 抽样 分 布 近似 正 态 . 判断 
样本 容量 足够 大 的 经 验 法 则 同 7.8 节 给 出 的 , Enp, npr, ngi A ng 的 值 都 大 于 等 于 4. (如 果 
PEDE ER 那么 可 以 采用 第 9 章 介绍 的 方法 来 比较 P Ap.) 
近来 正 兴起 一 场 运动 , 鼓励 人 们 合伙 拼车 上 班 以 节约 能 源 . 一 些 城市 则 采取 措施 , 指定 
USE ARRIBA RO IE D t t, 为 了 评价 该 计划 的 效果 ， 
某 一 城市 的 收费 站 工作 人 员 分 别 在 拼车 专用 公路 上 于 计划 实施 前 后 随机 选取 了 2 000 辆 和 1 500 辆 
汽车 . 调查 的 结果 见 表 8.6, Hah y, My 分 别 代表 计划 实施 前 后 样本 中 载 有 两 人 以 上 的 汽车 数量 . 
这 些 数据 能 和 否 证 明 计划 实施 后 合 乘 汽车 的 比率 有 所 提高 ? a = 0. 05. 











EO WREX p 和 p, 分 别 表示 建立 拼车 道 表 8.6 例 8. 17 拼车 研究 结果 
前 后 拼车 的 真实 比率 , 那么 检验 的 要 素 为 : 建立 拼车 道 之 前 ”建立 拼车 道 之 后 
Ho: (p, - p) =0 样本 容量 n, =2 000 n, -1 500 


拼车 数 y, 7652 y, = 576 
H,: (py - p) «0 


〈 因 为 我 们 只 关心 拼 乘 汽车 的 比率 是 否 有 所 提高 ， Ao 
Bl p; >p1, 所 以 检验 为 单 侧 的 . ) ` 
检验 统计 量 : Z= (pi - P5) -0 
Tb -b:) 
拒绝 域 : a =0. 05 
© Z< —z,= -Z005 = -1.645 ( 见 图 8.19) 














. A 
现在 计算 样本 的 拼 乘 汽车 比率 : -zoos = — 1.645 0 =z 
^ 652 ^ 拒绝 域 
P1 75 ggg 70-326 DETUR 384 Z= 356 


检验 统计 量 是 图 8. 19 练习 8.17 的 拒绝 域 
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_ (pi - pj) a (bi -P2) 
roo f ELI) 
nj; nm 
其 中 ， 
. yt 6524576 _ 
P7. +n, 2000+150 79 791 
因此 ， 
0. 326 — 0. 384 _ 0.058 _ _ 
1.79013 "^ 3 56 
de 351) (0. 649) [> 006 * ; 300) 


HF Z= -3.56 落 入 拒绝 域 , 所 以 我 们 有 充足 的 证 据 (a 20.05) W Pr dr Bi 3 + Fit 5 


率 提高 了 . 


拼 汽 车 的 比 


如 果 对 估计 比率 提高 的 范围 感 兴趣 可 以 给 出 (pi -ps) 的 置信 区 间 . 


© 应 用 练习 
8.56 地 下 井 水 污染 . 参考 练习 7. 60, Environmen- 
tal Science & Technology(2005 年 ] 月 ) 关 于 美 国 
新 罕 布什 尔 州 甲 基 板 丁 基 醚 (MTBE) 污染 地 下 
井 水 情况 的 研究 . 将 223 口 井 按照 井 的 种 类 ( 公 
用 还 是 私 用 ) 和 MTBE 检测 水 平 ( 低 于 限制 或 检 
出 ) 划 分 . 下 面 的 MINITAB 输出 结果 分 别 给 出 了 
120 口 公 用 井 和 103 口 私 用 井 的 样本 中 处 于 两 
种 检测 水 平 的 井 的 数量 . 
a. 对 公用 井 和 私 用 井中 检 出 MTBE 水 平 的 真实 比 
率 是 否 相等 进行 双 侧 检验 . 用 a = 0. 05. 
b. 在 练习 7. 60 F, 你 已 经 用 95% 置信 区 间 比 较 了 
两 个 比率 , 解释 由 a 中 双 侧 检验 的 推断 与 根据 
置信 区 间 得 到 的 推断 一 致 的 原因 ， 





Tabulated statistics: MTBE-Detect, WeilClass 
Rows: MTBE-Detect Columns: WellClass 


Private Public All 


Below Limit 81 72 153 
Detect z2 48 ?0 . 
A11 103 i20 223 


Cell Contents: Count 











练习 8. 56 的 MINITAB 输出 结果 


8.57 流体 力学 的 普及 . Journal of Professional Issues in 
Engineering Education and Practice( 2005 年 4 月 ) 报告 
T 2005 年 对 大 学 生 工程 教学 大 纲 提供 的 课程 调查 


结果 . 在 参加 2005 年 调查 的 90 个 工程 教学 大 纲 中 ， 


eo 


68 个 包括 了 流体 力学 . 20 年 前 曾 进行 过 同样 的 调查 
(Engineering Education, 1986 年 4 月 ), 100 个 被 调 
查 的 工程 教学 大 纲 中 有 66 个 包括 了 流体 力学 . 检验 
2005 年 在 大 学 生 工 程 教学 大 纲 中 包括 流体 力学 的 比 
率 是 否 比 1986 年 有 所 增加 . 利用 a =0.01. 

58 暂停 不 用 的 油气 建筑 物 . 参考 练习 3.17, Oil 
& Gas Journal(2006 年 1 月 3 日 ) 关 于 位 于 墨西哥 
湾 的 3 400 个 油气 建筑 物 的 研究 . 下 表 按 照 不 同 的 
类 型 ( 沉 箱 、 油 井 保护 器 或 固定 栈桥 ) 和 状态 (正在 
使 用 或 者 暂停 不 用 ) 对 这 些 油气 建筑 物 分 类 进行 分 
Br. 假定 这 3 400 个 建筑 物 作为 世界 范围 所 有 建筑 
物 的 一 个 代表 性 样本 . 











构造 类 型 
UE “油井 保护 器 固定 栈桥 总 计 
正在 使 用 503 255 1 447 2 175 
暂停 不 用 598 177 450 1 225 
总 计 1 101 402 1 897 3 400 


资料 来 源 : Kaiser, M. 
lates idle Gulf of Mexico structures. ” 
103, No. 1, Jan. 3, 2005( 表 2). 


a 检验 沉 箱 建筑 物 中 暂停 不 用 油气 建筑 物 比 率 是 
否 超过 油井 保护 器 建筑 物 中 暂停 不 用 油气 建筑 
WER. a =0. 10. 

b. 检验 沉 箱 建 筑 物 中 暂停 不 用 油气 建筑 物 比 率 是 
否 超过 固定 栈桥 建筑 物 中 暂停 不 用 油气 建筑 物 
比率 . a =0. 10. 

e. 检验 油井 保护 器 建筑 物 中 暂停 不 用 油气 建筑 物 
比率 是 否 超过 固定 栈桥 建筑 物 中 暂停 不 用 油气 


, and Mesyanzhinov, D. “Study tabu- 
Oil & Gas Journal, Vol. 
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gs 





8. 


œ 


oo 


建筑 物 比率 . a =0. 10. 

59 低 氧 杀 忠 . 参考 练习 8.50, Journal of Agricul- 
tural, Biological, and Environmental Statistics ( 2000 
年 9 月 ) 关 于 暴露 于 低 氧 的 稻 象 鼻 虫 死亡 率 的 研 
究 . 实验 中 将 称 象 鼻 虫 暴露 于 氮气 4 天 后 , 31 421 
只 称 象 鼻 虫 中 有 31 386 只 死亡 . 在 第 二 个 实验 中 ， 
将 稳 象 鼻 虫 暴露 于 氮气 3.5 天 后 , 发 现 23 676 只 
稻 象 鼻 虫 中 有 23 516 RET. 对 稳 象 择 虫 成 虫 暴露 
于 氮气 环境 中 两 次 不 同 暴露 时 间 的 死亡 率 进行 比 
E, 两 个 实验 中 稻 象 鼻 虫 的 死亡 率 有 显著 的 差异 
吗 ? (a —0.10) 


.60 EIEE. 科学 家 把 世界 上 树 吾 数量 的 灾 


难 性 减少 与 地 球 的 被 破坏 臭氧 层 发 射 的 紫外 线 联 
系 在 一 起 ( Tampa Tribune, 1994 年 3 月 1 日 ). 由 于 
太平 洋 树 峙 产生 一 种 酶 , 这 种 酶 能 够 保护 它 的 卵 
免 受 紫外 线 的 伤害 ,所 以 认为 太平 洋 树 蛙 的 数量 
不 会 减少 . 俄勒冈 州立 大 学 的 研究 者 将 两 组 太平 洋 
树 蛙 卵 的 锤 化 率 进行 了 比较 , Fore — p eb SE 
外 线 遮 阳 防 护 ， 而 另 一 组 蛙 卵 没有 防护 . 下 表 给 出 
了 每 组 蛙 卵 成 功 黎 化 的 数量 . 利用 假设 检验 比较 两 
组 太平 洋 树 蛙 的 孵化 率 . a = 0. 01. 


有 遮阳 防护 的 没有 遮阳 防护 的 





fE BH BEBE 
总 数 70 80 
孵化 数量 34 31 


. 61 工程 与 技术 学 位 . 除了 传统 的 工程 学 十 学 位 以 


外 , 全 世界 的 许多 大 学 也 向 希望 以 后 成 为 工程 技术 人 
员 的 学 生 授予 技术 学 士 学 位 . 人 们 有 一 个 观念 , 认为 
技术 学 士 学 位 的 学 生 学 术 能 力 没有 工程 专业 的 学 生 
强 . International Journal of Continuing Engineering Edu- 
cation and. Lifelong Learning (Vol. 13, 2008) 中 提 到 了 
这 一 观点 . 研究 者 比较 了 一 所 澳大利亚 大 学 的 工程 专 
业 和 技术 专业 学 生 与 某 类 学 术 有 关 的 成 绩 . 下 表 给 出 
了 传统 两 大 严格 课程 (工程 数学 和 工程 制图 /CAD) 中 


工程 专业 和 技术 专业 的 不 及 格 率 . 
8.11 检验 总 体 方差 


意 的 是 , 无 论 样 本 容量 大 小 , 都 需要 满足 正 态 性 假定 . 














工程 数学 工程 学 士 学 生 技术 学 士 学 生 
参加 考试 人 数 537 117 
不 及 格 率 (% ) 27.8 19.7 
工程 制图 /CAD ”工程 学 士 学 生 技术 学 士 学 生 
参加 考试 人 数 727 374 
不 及 格 率 ( % ) 39.5 52.1 


资料 来 源 : Palmer, S. , 


ic performance of engineering and technology students at 


and Bray, S. “ Comparative academ- 


Deakin University, Australia. " International Journal of Con- 
tinuing Engineering Education and Lifelong Learning, Vol. 
13, No. 1-2, 2003( € 5 和 表 8). 


a. 是否 有 足够 的 证 据 表 明 , 在 工程 数学 课程 中 , T. 
程 专业 和 技术 专业 的 学 生 不 及 格 率 存在 差异 ? 
用 a =0. 05 检验 . I 

b. 是 否 有 是 够 的 证 据 表 明 , 在 工程 制图 /CAD 课程 
中 , 工程 专业 和 技术 专业 的 学 生 不 及 格 率 存在 
差异 ? 用 a = 0. 05 检验 . 


` 62 主动 和 被 动 的 太阳 能 加 热 . 家 庭 太 阳 能 加 热 


系统 可 以 分 为 两 类 , 被 动 的 太阳 能 加 热 系 统 和 主 
动 的 太阳 能 加 热 系 统 . 对 于 被 动 的 太阳 能 加 热 系 
统 ,房子 本 身 作为 一 个 太阳 能 收集 器 . 而 对 于 主 
动 的 太阳 能 加 热 系统 , 则 利用 复杂 的 机 械 设备 把 
太阳 光 转 变 为 热能 . 比较 主动 和 被 动 太 阳 能 加 热 
系统 中 每 年 燃料 油 消耗 小 于 200 加 仑 所 占 比率 的 
差异 . 随机 独立 地 各 选择 50 个 主动 和 被 动 太阳 能 
加 热 家 庭 的 样本 , 给 出 去 年 燃料 油 消耗 小 于 200 
加 仑 的 数量 , 结果 列 于 下 表 . 是 否 有 证 据 表明 主 
动 和 被 动 太阳 能 加 热 系统 中 去 年 燃料 油 消耗 小 于 
200 加 仓 的 比率 存在 差异 ? 在 a = 0. 02 的 显著 性 
水 平 下 检验 . 


被 动 的 太阳 能 主动 的 太阳 能 
家 庭 个 数 50 50 
去 年 需要 燃油 小 于 


200 加 仑 的 家 庭 数 37 46 
———————————— (C  _ 





回忆 7. 9 节 , 估计 单个 总 体 方差 o? 的 枢 轴 统计 量 不 服从 标准 正 态 (Z) 分 布 . 因此 ， 当 我 们 检验 
c^ 的 假设 时 不 能 用 8. 3 节 给 出 的 方法 . 
但 当 样 本 来 自 于 正 态 总 体 时 ， 枢 轴 统 计量 服从 卡 方 (2 ) 分 布 ， 检验 步骤 见 下 面 的 框 格 . 值得 注 
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单个 总 体 方差 o° 的 假设 检验 


单 侧 检验 双 侧 检验 
H: o? =o Hy; o? - 0$ 
H: P> [Xx H,: o? <o] H,: o? xo, 


Oo 


拒绝 域 : 拒绝 域 : 
X >x. CRX. «1 X XX on UE y Xan 
RPE PLAIRE BEAN- DAY 分 布 右 侧 面积 为 a 和 左 侧面 积 为 a 所 对 应 的 x E. 
( 注 : o) 表示 原 假 设 中 指定 的 o^ 某 个 值 ，) 
假定 : 抽取 随机 样本 的 总 体 有 近似 正 态 分 布 . 











参考 练习 7. 14, REA ELERA RKHS EWA. 假定 制订 规章 的 代理 商 指定 装 入 量 
的 标准 差 必须 小 于 0. 1 368]. 质量 控制 检查 员 38.7 WS EATEN 
选取 了 10 MRL, 并 检测 每 一 听 的 装 人 量 . 数 7.96 7.90 7.98 8.01 7.97 7.96 8.03 8.02 8.04 8.02 
据 复制 在 表 8.7 中 . 这 些 信息 是 否 提 供 了 足够 ” CV 
的 证 据 表明 装 和 人 量 测量 值 的 标准 差 r 小 于 0. 1 A7? 
解 ” 由 于 原 假设 和 备 择 假设 必须 用 o?( 而 不 是 o) 来 表示 , 所 以 我 们 检验 原 假设 o7 = 0. 01 对 备 
择 假 设 o? «0.01. 此 检验 的 要 素 为 : 
Ho: o2=0.01 ( 即 o=0.1) 
H,:o2 <0.01 (Hla <0.1) 
假定 : 装 入 量 总 体 近似 服从 正 态 分 布 . 
检验 统计 量 : pD -Ds 
Oo 
拒绝 域 : 我 们 观测 到 的 s? 值 越 小 , 有 利于 H, 的 证 据 越 强 , 所 以 检验 统计 量 的 “小 值 ” 拒 绝 Ho. 
对 于 wa =0.05, df =9 PF, 拒绝 H, 所 对 应 的 x? 值 可 由 附录 B 表 8 查 得 , 并 在 图 8. 20 标 出 . in y? < 
3.32511, 我 们 拒绝 Ho. (TEX B. 8 给 出 的 面积 是 表 中 数值 右 侧 的 面积 . 因此 , 为 了 确定 数值 左 侧 面积 
为 a=0.05 的 下 侧 值 , 我 们 用 表 8 中 x %5 列 的 值 . ) 
为 了 计算 检验 统计 量 , 我 们 需要 计算 样本 标准 差 s. 图 8.21 的 EXCEL 输出 给 出 了 样本 数据 的 数 
值 描述 性 统计 量 , s 值 (输出 中 阴影 部 分 ) 为 *=0. 043. 将 s=0.043, n=10 和 el 20.01 代入 公式 计算 
检验 统计 量 , 得 


=1. 664 





2 _ (10 -1)(0.043)? 
X 7 0.01 
注意 图 8.21 EXCEL 输出 的 底部 给 出 了 这 个 检验 统计 量 的 值 和 相应 的 p 值 (0. 0043 ) . 
结论 : 由 于 检验 统计 量 x =1. 66 小 于 3.32511( 或 者 由 于 a=0.05 >p {Ë =0. 0043 ) ,检查 员 可 以 
断定 (在 a=0.05) 所 有 装 人 量 的 总 体 方差 小 于 0.01(o <0.1). 如 果 反 复 应 用 这 种 方法 , 那么 只 有 
5% 的 次 数 不 正 确 地 拒绝 Ho. 所 以 质量 控制 检查 员 相 信和 经 头 厂 正常 运行 , 装 入 量变 异性 在 要 求 范围 
内 的 决定 . 
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图 8.20 练习 8.18 的 拒绝 域 图 8.21 练习 8. 18 的 EXCEL/PHSTAT2 输出 
应 用 练习 0. 10 检验 


8.63 ” 冰 融 化 池 的 反照 率 . 参考 练习 7. 70, 关于 国家 
冰雪 数据 中 心 收集 冰 融 化 池 反 照 率 数据 的 研究 . 位 
于 加 拿 大 北极 地 区 504 个 冰 融 化 池 的 反照 率 数 据 
保存 于 PONDICE 文件 中 . 

a. 检验 (a =0. 10) 位 于 加 拿 大 北极 地 区 所 有 冰雪 融 
化 池 反 照 率 的 真实 方差 不 等 于 0. 0225. ( 注 ; 对 
503 A~ È H BERI Xaos =451. 991, x s = 556. 283. ) 

b. 讨论 a 中 检验 的 实际 显著 性 . (提示 ， 利用 练习 
7. 70 算得 的 90% 置信 区 间 . ) 

8.64 RILIR. 参考 练习 8.23, Journal for Engineering 
Jor Industry(1993 年 5 月 ) 关 于 在 钻 悄 拥塞 情况 下 深 孔 
钻探 的 问题 研究 . 检验 钻 悄 长 度 的 真实 标准 差 是否 不 
等 于 75 mm. 由 n=50 的 钻 悄 数据 , s =50.2. 

8.65 电子 信号 理论 . 记录 大 脑 的 电子 活动 对 于 临床 
问题 和 神经 生理 学 研究 都 很 重要 . 为 了 改善 电子 活 
动 中 的 信 噪 比 ， 有 必要 反复 地 刺激 受 试 者 ， 卓 平均 
响应 (假定 单个 响应 是 同 质 的 -种 方法 )， 进行 一 
项 检验 同 质 信 号 理论 的 研究 (1EEE Engineering in 
Medicine and Biology Magazine, 1990 年 3 月 ). 原 假 
设 是 试验 者 信 品 比 读数 的 方差 等 于 依据 同 质 信号 
理论 得 到 的 “期 望 ”水 平 ， 在 这 项 研究 中 ,“ 期 望 ” 
水 平 设 为 0. 54. 如 果 信 品 比 的 方差 超过 这 个 水 平 ， 
研究 人 员 认 为 信号 不 是 同 质 的 . 

a. 为 研究 人 员 建 立 原 假设 和 备 择 假设 . 

b. 41 个 正常 儿童 的 样本 记录 的 信 品 比 范围 从 
0. 03 ~3. 0. 利用 这 个 信息 得 到 样本 标准 差 的 估 
计 值 . (提示 : 信 噪 比 服 从 正 态 分 布 , 并且 总 体 
中 大 多 数 信 品 比 落 在 u + 2o 范围 内 ， 即 从 
人 -2 ~ 人 +2c 的 区 间 长 度 等 于 40. ) 

c. 利用 b rp s 的 估计 值 进 行 a 中 的 检验 . 利用 a = 


8.66 水 的 消毒 剂 . 最 普遍 的 饮用 水 消毒 方法 是 使 用 游 
AERA, HERE 即 应 用 游离 毛 化 之 前 往 水 中 添 
加 氨 ) 作 为 另 一 个 处 理 方法 受到 相当 的 重视 在 一 项 
研究 中 , 44 个 采用 预先 氨 化 水 样品 的 平均 污水 混浊 度 
是 1.8, 标准 差 为 0. 16( American Water Works Journal, 
1986 ££ 1 H). 是 否 有 足够 的 证 据 表明 采用 预先 氨 化 
方法 处 理 的 水 样品 污水 混浊 度 的 方差 超过 0. 0016? 
(数值 0.0016 表示 已 知 的 采用 游离 氧化 处 理 水 样品 污 
水 混浊 度 的 方差 . ) 用 a =0. 01 检验 . 

8.07 A SEX. 某 公 司 生产 32 sr] S Eten de 
快 于 橡胶 胶水 . 某 质 量 控制 检查 员 想 检验 每 镶 橡 胶 
胶水 重量 的 方差 是 否 超过 0.3, 如 果 超 过 0.3, 分 装 
机 需要 调整 . 由 于 检查 装 缸 过 程 需要 关 掉 分 装机 ， 
而 停工 任意 一 段 时 间 ， 公司 都 会 损失 上 千 美 元 , 所 
以 检查 员 只 能 得 到 10 铅 随 机 样本 来 检验 . 经 过 称 重 
后 , 检查 员 计 算出 下 面 的 概括 统计 量 . 

Y=31.55 dH] s-0.48 ain. 

a. 样本 数据 是 否 证 明 分 装机 需要 调整 ? 在 显著 性 
水 平 a =0. 05 检验 . 
b. 为 了 a 中 的 假设 检验 有 意义 ， 需要 什么 假定 ? 

.68 检测 多 和 气 联 某 . 在 制造 大 型 变压器 和 电容 器 中 
HILAK, 如 果 它 泄漏 到 环境 中 是 极端 危险 
的 污染 物 . 美国 环保 署 正 在 用 - -种 新 的 装置 来 检测 
fü rp e SURE UM HE 为 了 检验 新 仪器 的 精密 度 ， 
对 同一 个 鱼 样本 给 出 了 7 个 多 氯 联 苯 检 测 数据 . 数 
据 ( 百 万 分 之 一 ) 如 下 : 

6.2 5.8 5.7 6.3 5.9 5.8 6.0 
假定 美国 环保 署 要 求 用 多 氯 联 茶 读数 的 方差 小 于 
0.1 的 仪器 . 那么 这 种 新 的 仪器 是 否 符合 美国 环保 
署 的 要 求 ? 在 a =0. 05 检验 . 


œ 


CPE _ 


w. 


假设 检验 





8. 12 检验 两 个 总 体 方差 的 比 
如 同 单 样本 情况 ,比较 两 个 总 体 方差 =+ 和 o3 的 枢 轴 统 计量 服从 非 正 态 抽样 分 布 . 由 7. 10 节 ， 


在 一 定 条 件 下 , 样本 方差 的 比 51/52 服从 下 分 布 . 
两 个 总 体 方差 比 of/o3 的 假设 检验 要 素 列 于 下 面 的 框 格 中 . 


两 个 总 体 方差 比 四 /ez 的 假设 检验 : 独立 样本 





单 侧 检验 双 侧 检验 
2 2 

Hn, Z- H: 121 
9, 05 
o? di 

H,: —>1 H,: 1 


(R# H: I1) 
95 


检验 统计 量 : 检验 统计 量 : 

ñ ñ Ë ME Es» 
-egy p. 学 = 较 大 的 样本 方差 | > 
FegOMEregn FTROMSHATE Qa ， ， 

一 #rs >s 
si 2 1 
拒绝 域 : EAR: 
F»F, F»FE, 


其 中 F, 和 Fua 分 别 是 wm = 分 子 的 自由 度 ( 即 分 子 中 样本 方差 的 自由 度 ) 和 四 = 2-3 88 B IH JE ( ËB 229 th jk 
本 方差 的 自由 度 ) 的 下 分 布 面积 为 a 和 oa/2 处 的 值 . 
假定 ; 1. 被 抽取 样本 的 两 个 总 体 有 近似 正 态 的 相对 频率 分 布 . 
2. 随机 样本 是 独立 地 从 两 个 总 体 中 抽取 的 . 














DEMEI 给 野 免 注射 大 量 的 环 氧 乙 烷 (ETO) 证 明 可 以 显著 地 改变 细胞 的 DNA 结构 . 虽然 人 们 知道 
这 是 一 种 诱 变 因 素 及 可 疑 的 致癌 物 , 但 是 医院 还 在 用 它 消毒 . 一 项 研究 调查 了 ETO 对 从 事 消毒 医务 
人 员 的 影响 , 随机 选取 了 31 名 受 试 者 , 并 分 为 两 组 , 指派 不 同 的 任务 . 其 中 13 名 受 试 者 负责 开启 和 
RRA ETO 的 灭 菌 枪 ( 任务 1) , 其 余 的 18 名 受 试 者 负责 开启 含有 ETO 的 灭 菌 包 ( 任 务 2). 任务 完 
成 后 , 研究 人 员 检 测 每 一 名 受 试 者 血液 中 ETO 的 含量 (mg). 表 8.8 给 出 了 计算 结果 , 这 些 数据 是 否 
提供 充足 的 证 据 证 明 指 派 两 项 任务 的 受 试 者 ETO 水 平 的 变异 性 存在 差异 ? 利用 w =0. 10 检验 . 





解 设 o?= 指 派 为 任务 1 受 试 者 ETO 水 平 的 总 体 方差 ， 表 8.8 $8.19 的 概括 数据 
o = 指派 为 任务 2 受 试 者 ETO 水 平 的 总 体 方差. 任务 1 任务 2 
为 了 使 这 个 检验 能 给 出 有 效 的 结果 ,必须 假定 两 组 ETO AS P » Ë o0 
水 平 的 样本 来 自 正 态 总 体 , 并 且 样 本 是 独立 的 . 标准 差 3.10 1.93 
我 们 关心 的 假设 是 : 
ai 
M: =1 (gi=o2) 
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o 
H,: 5*1 (oi*o2) 
o 


2 
附录 BF 分布 表 的 性 质 影响 检验 统计 量 的 形式 . 为 了 得 到 双 侧 检验 的 拒绝 域 , 我 们 想 采用 上 
Fé, 因为 表 B.9 ~ B. 12 只 有 下 分 布 的 上 侧 值 . 基于 这 一 点 , 我 们 总 是 把 较 大 的 样本 方差 作为 严 检 验 
统计 量 的 分 子 . 由 于 总 是 把 较 大 样本 方差 作为 分 子 , 所 以 应 将 F 比 落 和 人 上 尾 的 概率 乘 2, 这 也 使 表 中 
a 值 加 倍 . 也 就 是 说 , 我 们 利用 较 大 方差 作为 分 子 而 不 是 建立 双 侧 的 拒绝 域 进 行 双 侧 检验 . 
所 以 在 本 例 中 , 自由 度 df =n, -1- 12 KAF s? MAHE df= n, -1=17 M94) E 2. 因此 检验 统 
计量 : 
严 = 较 大 的 样本 方差 s 
较 小 的 样本 方差 ”如 





当 算得 的 三 值 超过 表 中 的 数值 
Fan = Fo os =2. 38 
时 , 将 在 w=0. 10 JE26 H: o? = 92. 
现在 可 以 计算 检验 统计 量 的 值 ,并 完成 分 析 ， 
sî (3.10)? 9.61 
sj (193)? 3.72 
当 把 它 和 图 8.22 中 的 拒绝 域 比较 时 , 可 以 看 出 =2 58 落 入 拒绝 域 中 . 因此 , 数据 提供 了 充足 的 证 
据 证 明 两 个 总 体 方差 不 同 . 由 此 表明 ， 负责 开启 灭 菌 包 ( 任务 2) 受 试 者 有 比 负责 开启 和 外 载 灭 菌 枪 
(任务 1) 的 受 试 者 较 小 变化 的 ETO KE. 
PE: 也 可 以 用 检验 的 p 值得 到 恰当 的 结论 . 图 8.23 的 MINITAB 输出 中 给 出 了 (阴影 部 分 ) 双 侧 下 
检验 的 p 值 . 因为 p 值 =0.073 小 于 w =0.10， 所 以 有 充足 的 证 据 拒绝 Hy. 
AD 





=2. 58 























Test for Equal Variances 
2 20.05 
/ ` 905 Bonferroni confidence intervals for standard deviations 
[ Sample N Louer StDev Upper 
P> F 1 13 2.22297 3.10000 5.11728 
0 1 2,443 4 5 6 2 18 1.44730 1.92873 2.89144 
2.58 
拒绝 域 一 F-Test (normal distribution) 
Test stetistic = 2.58, p-value = 0.073 
F-238 
图 8.22 458.19 的 拒绝 域 图 8.23 例 8.19 的 MINITAB 输出 


如 果 例 8. 19 中 根据 样本 计算 的 严 值 没 有 落 入 拒绝 域 ， 将 会 得 到 什么 结论 ? 会 断言 方差 相等 的 原 假 
设 是 正确 的 ? K, 因为 不 知道 8 值 , 即 如 果实 际 上 Hy: ot =03 是 假 的 ， 却 没有 拒绝 原 假设 的 概率 ,你 
要 骨 险 犯 工 型 错误 的 可 能 性 (如 果 玉 是 真 , 没有 拒绝 Hy). 由 于 不 考虑 计算 指定 备 择 假设 的 p di, 所 以 
当下 统计 量 没有 落 人 拒绝 域 时 ， 只 能 有 简单 的 结论 ， 没有 充分 的 样本 证 据 来 反驳 原 假设 o? = 92. 


假设 检验 
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例 8. 19 介绍 了 在 双 侧 检验 中 计算 检验 统计 量 和 拒绝 域 的 方法 ， 这 种 方法 避免 了 确定 到 分 布下 
W FERR. 这 种 方法 对 于 单 侧 检验 更 容易 完成 , 因为 我 们 能 控制 如 何 指定 H, RI H. 中 总 体 方差 
的 比 . 也 就 是 说 , 我 们 总 是 能 够 使 单 侧 检验 成 为 上 侧 检验 . 例如 ,如果 想 检验 o2 是 否 大 于 o, 那么 
我 们 把 备 择 假设 记 为 : 


of 2. 2 
H.: —y>1 (Bil o1 >05) 
o 


2 


合适 的 检验 统计 量 是 =s?/s3. 反之 , 如 果 想 检验 o1 是否 小 于 o2 (Bl o2 是 否 大 于 o?), 则 记 为 


03 2 2 
H,: —>1 (Hl o5 » o1) 
91 


对 应 的 检验 统计 量 是 下 = $2/s?. 
应 用 练习 


8. 


œ 


69 森林 入 口 通 道 的 属性 . 参考 练习 7.76 , Inter- 
national Journal of Forest Engineering (1999 年 7 月 ) 
关于 爱尔兰 森林 入 口 通道 的 属性 研究 . 32 个 矿石 
路 基 通 道 和 40 个 泥 煤 路 基 通 道 作 为 独立 随机 样 
本 , 测量 瞬 变 表面 垂 度 (mm), 结果 复制 于 下 表 . 











公路 路 基 
矿石 泥 煤 
道路 数量 32 40 
平均 表面 
EIE (mm) 1. 53 3. 80 
标准 差 3. 39 14.3 


资料 来 源 : Martin, A. M. 
ability of forest access roads. " International Journal of Forest 
Engineering, Vol. 10, No. 2. July 1999 ( & 3). 


a 用 双 侧 假设 检验 比较 两 种 类 型 道路 的 表面 垂 度 
方差 . a = 0. 05. 

b. 在 练习 7. 76 中 , 你 利用 95% 置信 区 间 比 较 两 个 
表面 垂 度 方差 . 证 明 由 假设 检验 和 置信 区 间 所 
得 到 的 推断 是 一 致 的 . 总 是 这 样 吗 ? 解释 原因 . 


，et al. “ Estimation of the service- 


.70 燃气 轮机 的 冷却 方法 . 参考 练习 8. 33 Journal 


of Engineering for Gas Turbines and Pouer ( 2005 年 1 
月 ) 关 于 燃气 轮机 的 高 压 雾 状 人 风 方 法 的 研究 . 三 
种 类 型 燃气 轮机 (高 级 、 航 改 、 传统) 的 热 消 耗 率 数 
TRCkJ/kW - h) {EFTE GASTURBINE 文件 中 . 为 了 
比较 其 中 两 种 类 型 燃气 轮机 的 平均 热 消耗 率 , 假 
定 热 消耗 率 的 方差 相等 . 
a 检验 传统 和 航 改 燃气 轮机 热 消 耗 率 的 方差 相等 
性 (a =0.05). 利用 这 个 结果 陈述 练习 8. 33a 所 
得 推断 的 正确 性 . 


8. 


œ 


œ 


b. 检验 高 级 和 航 改 燃气 轮机 热 消 耗 率 的 方差 相等 
性 (a 20. 05) . 利用 这 个 结果 陈述 练习 8. 33b 所 
得 推断 的 正确 性 . 

71 采 园 中 杀 忠 剂 的 使 用 . 参考 练习 8.37, Eni- 

ronmental Science & Technology 关于 比较 加 利 福 尼 亚 

果园 在 两 种 天 气 条 件 ( 有 和 雾 天 气 和 晴 ( 或 多 云 ) 天 

气 ) 下 氧 / 硫 比 的 均值 研究 , 数据 保存 在 ORCHARD 

文件 中 . 在 比较 均值 时 要 求 方差 相等 , 检验 等 方差 

的 假设 . 利用 o =0. 05. 


.72 雨水 采样 器 的 精度 . 雨水 采样 器 是 检测 雨水 化 


学 成 分 的 标准 方法 , 但 贮 水 读数 的 准确 度 可 能 依 
赖 于 现场 设置 采样 器 的 个 数 . 荷兰 曾 进 行 过 这 样 一 
项 实验 , 收集 了 设置 在 某 地 的 1 ~8 个 相同 的 雨水 
采样 器 贮 水 数据 ( Atmospheric Environment, Vol. 
24A, 1990) ,对 于 每 一 个 采样 器 (或 采样 器 组 合 ) ， 
收集 了 全 年 每 24 h 的 数据 , 每 个 采样 器 (或 采样 器 
组 合 ) 共 有 365 个 数据 . 当 只 使 用 一 个 雨水 采样 器 
时 , 氧 读数 的 标准 差 ( 相 对 于 8 个 采样 器 平均 读数 
的 百分数 ) 是 6.396. 当 我 们 使 用 3 个 雨水 采样 器 
BI, 氧 读数 的 标准 差 (相对 于 8 个 采样 器 平均 读数 
的 百分数 ) 是 2.6%. 进行 一 个 检验 以 比较 两 种 抽 
样 方 案 氨 读数 的 方差 ( 即 一 个 雨水 采样 器 与 三 个 雨 
水 采样 器 的 比较 ). 利用 a =0. 05 检验 . 


.73 T 63. 曾经 有 一 项 实验 , 研究 加 固 泥 


凝 土 了 型 梁 加 固 轻 缘 对 容许 扭转 负荷 的 影响 (Jour- 
nal of the American Concrete Institute, 1 ~ 2. 1986). 
实验 中 采用 了 几 种 不 同类 型 的 T 型 梁 , 每 种 类 型 
A^ IBS SEHE. 在 实验 中 , 梁 在 扭转 和 弯曲 综 
合作 用 下 直至 失效 (断裂 ). 我 们 对 T REL ARE TR 
部 的 断裂 扭矩 感 兴趣 ,下面 分 别 给 出 了 具有 70 em 
和 100 em 平板 面 宽度 的 8 根深 的 断裂 扭矩 , 
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70 em 明 : 由 下 式 给 出 的 拒绝 域 
2 2 
板 层 宽 度 : 6.00, 7.20, 10.20, 13.20, 11.40, 13.60, Ap, 或 I Faan 
9.20, 11.20 s2 s2 
100 cm RP FAREN v = (ni -1) ffüv, = (n, - 1), 
板 层 宽度 : 6.80, 9.20, 8.80, 13.20, 11.20, 14.90, 与 下 面 所 给 出 的 拒绝 域 是 等 价 的 ; 
10.20, 11. 80 s 
> Fe 


a. 是否 有 证 据 表 明 两 种 类 型 的 T 型 梁 断 裂 扭 矩 方 
差 存在 差异 ? a =0. 10. 
b. 为 使 检验 有 效 要 求 什么 样 的 假定 ? 

8.74 i hk Wb kin jk. 参考 练习 6.71 关于 综合 痕 
量 有 机 物 监控 器 的 研究 . 从 位 于 英格兰 的 两 个 污水 
处 理 场 选取 样本 检测 总 有 机 碳 (TOC ) 水 平 . 下 面 的 
表格 给 出 了 邻近 这 两 个 污水 处 理 场 河流 中 TOC. 水 
平 的 汇总 信息 . 由 于 福克斯 科 特 污水 处 理 厂 附近 的 
河流 经 常 间 欣 性 溢出 工厂 的 入 口 并 不 太 远 的 上 游 ， 
所 以 认为 位 于 福克斯 科 特 TOC 水 平 会 比比 德 福 附 
近 河 流 具 有 较 大 的 变异 . 样本 信息 是 否 支 持 这 种 假 
it? 在 w =0.05 下 检验 . 





比 德 福 福克斯 科 特 
n, =61 n, =52 

y; 25.35 y, 24.27 
5; 20.96 s, =1. 27 


— — _ _ 2 
资料 来 源 : Pinchin, M. J. “A study of the trace organics profiles 
of raw and potable water systems. " Journal of the Institute of Wa- 
ler Engineers & Scientists, Vol. 40, No. 1, Feb. 1986, p. 87. 


理论 练习 


8.75 ”假定 我 们 想 检 验 甩 : o =o}, H.: ol o1. WE 


“8. 13 ”其 他 检验 方法 : 自助 法 和 贝 叶 斯 法 


œ 


Reb FRF o 个 分 子 自由 度 和 ç, 个 分 母 自由 
度 , 或 者 


其 中 F 依赖 于 vw 个 分 子 自由 度 和 wv 个 分 母 自 由 
BE. (提示: 利用 
1 


Fa- = ge 


(证 明 省 略 ) , HR FREF on MAFA BEM v 
个 分 母 自由 度 , F' 依赖 于 w 个 分 子 自由 度 和 wi 个 
分 母 自由 度 . ) 


.76 利用 练习 8.75 中 的 结果 证 明 : 


11 AM 
较 小 的 样本 方差 > Tn)" 
JER PARBCTAKT Bib = [ (作为 分 子 的 样本 广 
差 的 样本 容量 ) -1] ,分 母 自由 度 = [( 作 为 分 母 的 
样本 方差 的 样本 容量 ) -1]. 

较 大 的 样本 方差 
GEE: 首先 P| ERRER e) 
P(si/s) > FaR 83/5 > Fs) ,然后 利用 
P(E >F p) =0/2.) 


在 7. 14 节 中 , 我 们 介绍 了 求 告 信 区 间 的 两 种 其 他 方法 ; 自动 法 和 贝 叶 斯 法 . 这 些 方法 也 可 以 用 
于 构造 假设 的 统计 检验 . 在 一 定 抽样 条 件 下 , 尤其 是 当 数 据 不 满足 基本 假定 时 ,由 其 中 一 种 或 两 种 
方法 得 到 的 结论 可 能 比 8.4 ~8. 12 节 中 使 用 的 经 典 检验 方法 更 有 根据 . 


自助 法 假设 检验 


回忆 自助 法 是 牵涉 重复 抽样 的 蒙特 卡 罗 方法 一 一 即 从 原始 样本 数据 集合 中 重复 抽取 ( 有 放 回 
地 ) 容 量 为 n 的 样本 ,自助 法 检验 程序 是 利用 反复 抽样 来 近似 检验 的 观测 显著 性 水 平 (p 值 ) 利用 自 
助 法 对 总 体 均 值 检 验 的 p 值 估计 需要 的 步 又 , 列 于 下 面 的 框 格 中 . 





检验 总 体 均值 H,: u = BJ Ë Bh p 值 
Wy Yas Yas s y, 表示 来 自 均值 为 EO) =u RUE LARGE A n 的 随机 样本 . 
SERA 对 这 个 样本 计算 检验 统计 量 的 值 : L. = (了 -po)/(s/Y 友 .其 中 了 表示 样本 均值 ,s 是 样本 的 标准 差 . 
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步骤 2 选择 j, 其 中 j 是 将 要 重复 抽样 的 次 数 . (通常 j 是 一 个 非常 大 的 数 ， 如 j=1 000 或 /=3 00.) 
ERS 交换 样本 中 每 一 个 y 值 如 下 : x; =y; -了 +jo. 即 从 每 一 个 样本 值 y 减 去 样本 均值 ， 然后 加 上 
Ho. (这 一 步 将 产生 均值 等 于 H, 中 假设 的 均值 的 样本 值 . ) _ 
ERA 从 变换 后 的 样本 数据 集 xi, xa, ma, t, x, Fk EM R MUD n À X £i 
PRS 重复 步骤 4 0 X. 
FRO 对 每 个 自助 样本 计算 检验 统计 量 : t; 7 (x; 一 Jo)A(s/YVn) , XP x 和 s 分 别 是 自助 样本 j 的 均 
值 和 标准 差 . 
步骤 7 按照 下 面 的 方法 求 自助 法 估计 的 p 值 - 称 为 达到 的 显著 性 水 平 LASL ) - 
EU S CH,: ups) : ASL= (t >t KZO 
TUE IS CH,: y<): ASL= (p «tu RR) 
SURE IE CH, : uno): 
AsL- (5 > | ta. | ) 的 次 数 二 全 < 一 | tas | ) 的 次 数 
J 












































步骤 7 中 自助 法 的 ASL 是 基于 8.6 节 ( 定 义 8.4)p 值 的 定义 : p 值 是 观测 到 一 个 比 样本 计算 值 更 
育 离 Ho 的 检验 统计 量 值 的 概率 . 在 上 侧 检验 中 , 更 背离 H, 意味 着 检验 统计 量 的 值 比 样本 计算 值 更 
X. 在 下 面 的 例题 中 举例 说 明 自助 法 程序 . 
参考 例 8. 9 钢铁 制造 厂 茶 污 染 的 调查 研究 ， 20 份 空气 样品 的 一 个 随机 样本 中 ,确定 每 
一 个 茶 含 量 的 水 平 ( 百 万 分 之 一 ). (数据 保存 于 BENZENE 文件 中 , ) 职 业 安全 与 卫生 管理 局 想 检验 ， 
Ho: uz VE H.: p>1. 求 此 上 侧 检验 的 自助 法 ASL, 利用 a =0. 05 给 出 恰当 的 结论 . 

解 ” 为 了 求解 自助 法 ASL, 按照 上 面 列 出 的 步骤. 

步骤 1 由 例 8.9, 检验 统计 量 的 计算 值 是 1 =2.95. 

步骤 2 我 们 选择 j=1 000 次 重复 抽样 . 

PRI 7=2 14( 见 例 8.9) ,wo =1. 因此 变换 每 一 个 抽样 的 菜 含 量 水 平 : x = y, -7 to = y; — 
2. 14 4 1. 原始 样本 数据 和 变换 后 的 值 见 图 8. 24 的 MINITAB IEK. 

步骤 4~5 从 图 8. 24 变换 后 的 样本 数据 中 用 SAS 程序 产生 1 000 个 容量 n=20 的 随机 样本 (有 
放 回 地 选取 观测 值 ). 其 中 产生 的 前 3 个 样本 数据 列 于 表 8. 9. 







144 
254 140 
287 183 
oo -114 
391. 2.37: 
224 14 





3⁄4 127 X 8.9 从 图 8. 24 变换 后 数据 中 的 自助 法 重复 抽样 (前 3 个 样本 ) 

450 3.36 

s Ps 样本 1: -L14 3.89 1.75 0.12 0.12 3.36 3.57 146 35 14 
0.36 -0 7B 

450; 335 03 LI -1.14 1.83 3.89 -0.29 0.12 L4 -114 3.36 
503. 388 

me one 样本 2: 0.12 1.75 -0.93 1.4 3.36 03 -0.29 -0.99 -0.29 -0.93 
PIE 0.3 -0.93 -L14 -0.84 3.36 -0.29 1.4 127 L1 146 





"i 280. 148 
d 9; 1265, 012 样本 3: 3.57 0.3 -093 012 11 1.75 3.57 3.36 1.27 1.27 
图 8. 24 EH Jnd SB k 3 


-0.78 -1.14 1.83 -0. . . .77 -0.29 -0. 
的 MINITAB THER 78-1.14 1.83 -078 146 127 2.77 -0.29 -029 3.57 
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ERO 接 下 来 , 利用 SAS 得 到 1 000 个 样本 均值 和 标准 差 . 然后 由 这 些 值 , 利用 SAS 程序 计算 
检验 统计 量 : = (x; -1)/(/ 20), j=1,2,3, =, 1000. 

SRI 把 步骤 6 得 到 的 每 个 : 值 与 计算 的 检验 统计 量 as =2.95 比较 . 只 有 3 个 上 值 (出 现在 
样本 126, 962 及 966 中 ) 超 过 2.95. 因此 自助 法 ASL 值 等 于 ASL =3/1000 =0. 003. 

自助 法 达到 的 显著 性 水 平 是 对 检验 的 真实 p 值 的 估计 .( 注 ; 例 8.9 得 到 的 了 值 等 于 0.004. ) 由 
T a-0.05 超过 了 ASL 值 , 所 以 有 充分 的 证 据 拒绝 原 假设 , 并 且 得 出 结论 凡 > 1 

给 出 任意 总 体 参数 9 的 检验 自助 法 p 值 的 一 般 程序 超出 了 本 书 范围 . 如 果 希 望 了 解 这 些 方法 可 
以 参考 相关 文献 . 但 两 个 均值 差 (Wi -po ) 的 检验 程序 与 单个 均值 的 程序 非常 相似 . 把 步骤 列 在 下 
面 的 框 格 中 . 








检验 总 体 均值 相等 H,: (jx, -wz ) =0 的 自助 法 p f 
Wy, fs, 表示 来 自 均值 为 的 总 体 , REY n 的 随机 样本 的 均值 和 标准 差 . y, fo s, 表示 来 自 均值 为 
m 的 总 体 ， 容 量 为 zm 的 随机 样本 的 均值 和 标准 差 
步骤 1 计算 样本 的 检验 统计 量 值 ， 





t - £7 -) 
“~ A GstZn, ) + (si/n,) 
步骤 2 tj, 其 中 7 是 将 要 重复 抽样 的 次 数 . 
FRI 求 联 合 样本 的 均值 7， 然后 按照 下 面 的 方法 变换 每 一 个 样本 值 : 
样本 1: w=y 一 +y 样本 2: x, = y, - 3 +y 
( 即 对 个 样本 值 减 去 它 的 样本 均值 , 然后 加 上 7. ) 
步骤 4 从 第 一 个 样本 中 有 放 回 地 随机 抽样 坟 个 变换 的 值 ; 从 第 二 个 样本 中 抽取 n, 个 变换 的 信 . 
PRS 重复 步骤 4 共 次 . 
FRO 对 每 个 自助 样本 , 计算 检验 统计 量 : 
t = (x, -x,)Z/(siZn,) + (s /n,) ， 
其 中 x 和 s 分 别 是 样本 1 的 第 j 个 自助 样本 的 均值 和 标准 差 . 
xy 和 s 分 别 是 样本 2 的 第 j 个 自助 样本 的 均值 和 标准 差 . 
步骤 7 求 自 助 法 估计 的 p fÉ - 称 为 达到 的 显著 性 水 平 (ASL) 如 下 . 
Efl CH, : Ai -jw >0): ASL = (5 > t, BIKA) 
TRES CH, : p ~u <0): ASL = (t <t KR) 
AWM, : u, -pw 0); 
ASL - UL? [ta | 的 次 数 ) + (5 < - | toe | 的 次 数 ) 
J 





























贝 叶 斯 检验 方法 
Ei, y). a, cos Yn 表示 从 具有 未 知 参 数 9 的 总 体 中 选取 的 容量 为 n 的 随机 样本 . 关于 检验 0 
假设 的 贝 叶 斯 方法 把 0 看 做 一 个 有 已 知 先 验 分 布 h(9) 的 随机 变量 . 与 区 间 估 计 一 样 , 需要 求 后 验 分 
Agla |Y, yo, ys, =, ya), 正如 7.14 节 所 证 明 , 后 验 分 布 是 
) Jn, Y2» Ya» `, Yn |0) * h(0) 
fn. ya, ya, c Yn) 





g(8lyi, y, Ya, 77, Yn 
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其 中 ,f(y as ys ya) mf. yas V33, Yn 10) ` h(0)d0 

假定 你 想 检 验 Ho: 9< 0, 对 H,: 9 > 09. 最 简单 的 由 叶 斯 检验 是 利用 后 验 分 布 g(0 ly, yo, 
ya, , yx) 求 下 面 的 条 件 概 率 : 

P(0<0 ly, y2, ya, Y) P(0» 05 | yi, ys, yas t Yn) 

换 名 话说, 用 后 验 分 布 求 Hy RI H, 发 生 的 可 能 性 . 一 条 简单 的 原则 就 是 接受 具有 最 大 条 件 概 率 的 假 
设 . 即 

接受 Ho, WR PC Soo |yi, y2, ys, =, Ya) SP(O> 0o yy Y2, Y3, y.) 

拒绝 Ho( 即 接受 有 ,) , SIR PCO 65 lyi, Y2, ya, n Yn) <P(0>00] 1, yos ya, =, Yn) 

在 下 面 的 例子 中 说 明 贝 叶 斯 检验 方法 . 
考虑 从 未 知 成 功 概率 p 的 伯 努 利 概率 分 布 中 选取 容量 为 20 的 一 个 随机 样本 , 数据 (用 0， 
1 度量 ) 列 于 表 8. 10. 假定 p 的 先 验 分 布 是 参数 为 w =1， B=2 的 6 概率 分 布 . 利用 伯 努 利 值 的 和 进行 
Ho: p<0.5 X} H.: p»0.5 的 贝 叶 斯 检验 . 

38.10 伯 努 利 分 布 的 20 个 值 的 样本 
1 1 1 1 0 1 1 1 0 1 1 1 1 0 1 0 1 1 0 1 


解 d 7.20 可 知 ， 伯 努 利 随机 变量 和 三 服 从 成 功 概率 为 p, n = 20 的 二 项 分 布 . 我 们 还 知道 ， 
P 的 先 验 分 布 是 参数 为 a =1, B =2 的 B 分 布 . 在 例 7.20 中 证 明了 的 后 验 分 布 g(p | x) 是 参数 为 
e=(X+1), B2 (n- X 2)88 B 4g. 将 表 8.10 中 伯 努 利 样本 值 求 和 , £838] X = 15. 因此 , p 的 后 验 
分 布 是 参数 为 w= (X+1) 216, B2 (n-X42) =7 B B 分布. 

由 于 原 假设 和 备 择 假 设 是 Ho: p<0.5 RI H,: p 0.5, 需要 求 条 件 概率 P(p<0.5 | X =15) 和 
P(p>0.5 |X =15). 大 多 数 统计 软件 包 都 具有 计算 多 种 概率 分 布 的 概率 程序 , 我 们 使 用 MINITAB 对 
参数 为 a =16, 8 =7 的 B 分布 ， 求 P(p<0.5) 的 值 . 结果 (着 重 显示 的 ) 见 图 8.25. 能 看 到 P(p=0. 5 | 
X 215) 20.026, 所 DM P(p >0.5 | X=15) =1 - 0.026 =0. 974. 因为 与 有,: p >0.5 关联 的 条 件 概率 较 
K, 所 以 我 们 拒绝 H, 而 接受 已， 并且 得 出 结论 ， 成 功 的 概率 p 超过 0.5. 


Cumulative Distribution Function 





Beta with first shape parameter = 16 and second = 7 


X P( X <= x) 
0.5 0. 0262394 








图 8. 25 利用 B 概 率 函 数 (w=16,B=7)，P(ps0.5) 的 MINTTAB 计算 
贝 叶 斯 检验 的 另 一 个 方法 是 利用 后 验 分 布 求 被 检验 参数 的 (1 - ca) 100% EFKE. (H 7.12 
节 . ) 例 如 , 48.21 中 成 功 概率 p 的 90% 置信 区 间 是 P( L <p <U) =0.90, Kt Lf U 492 B Ay 
(a-16, B=7) 的 第 5 百 分 位 数 和 第 95 百 分 位 数 . 利用 MINITAB R B 函数 , 我们 可 以 求 出 p 的 
90% 置信 区 间 是 (0. 53, 0.84). 注意 到 这 个 区 间 没 有 包含 原 假设 的 值 0. 5， 置信 区 间 的 所 有 p 值 都 大 
于 0.5, 所 以 应 该 支持 备 择 假设 . 


应 用 练习 于 纤维 增强 聚合 物 (FRP) 复 合 材 料 承 重 强 度 的 研 
8.77 混凝土 FRP 条 的 承重 强度 . 参考 练习 7. 9, 55. 用 拉 挤 的 FRP 条 机 械 固定 公路 桥 并 检测 其 承 
Composites Fabrication Magazine(2004 年 9 月 ) 关 重 强度 ， 强度 检测 值 ( MPa) 列 于 下 表 . 利用 自助 法 
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检验 (a = 0. 10) 机 械 加 固 的 FRP 条 真实 平均 强度 
是 否 超过 230 MPa. 


——————————————————— _ 
240. 9 248. 8 215. 7 233. 6 231. 4 230. 9 225. 3 247. 3 235. 5 238. 0 


资料 来 源 : 数据 由 Composites Fabrication Magazine, Sept. 
2004, p. 32( 表 1) 提供 的 汇总 信息 模拟 得 到 . 


8.78 管道 的 表面 粗糙 度 . 参考 练习 8. 16, Anti- cor- 
rosion Methods and Materials( Vol. 50, 2003) 关于 油 
田 管 道内 表面 粗糙 度 的 研究 . 20 个 抽样 数据 ( 单 
位 : pm) 列 于 下 表 . 用 自助 法 检验 (a = 0.05) 管 道 
内 层 平均 表面 粗糙 度 是 否 等 于 2 mm. 比较 自助 法 
的 ASL 和 练习 8. 16 检验 得 到 的 p 值 . 

1.72 2.50 2.16 2.13 1.06 2.24 2.31 2.03 1.09 1.40 
2.57 2.64 1.26 2.05 1.19 2.13 1.27 1.51 2.41 1.95 
资料 来 源 : Farshad, F. , and Pesacreta, T. “Coated pipe in- 
terior surface roughness as measured by three scanning probe 


instruments. " Anti-corrosion Methods and Materials , Vol. 50, 
No. 1, 2003 ( € M). 


8.79 燃气 轮机 冷却 方法 . 参考 练习 8.33, Journal of 
Engineering for Gas Turbines and Power(2005 年 1 月) 
关于 采用 高 压 雾 状 人 风 的 三 种 类 型 燃气 轮机 的 研 
究 . 其 中 高 级 和 航 改 两 类 燃气 轮机 热 消耗 率 的 数据 
(kJ/kW .hh) 列 于 下 表 . 用 自助 法 检验 (a =0.05) 高 
级 和 航 改 两 类 燃气 轮机 的 平均 热 消耗 率 是 否 存在 差 
5. 比较 自助 法 的 ASL 和 练习 8.33b 检验 得 到 的 
p f&. 

高 级 972 10481 9812 9669 9643 9115 915 1l 588 
10888 9738 9295 9421 9105 10233 10 186 9918 
9209 9532 9933 9152 9295 

航 改 16 243 14 628 12 766 8 714 9 469 11 948 12 414 


快速 回顾 


重要 公式 
假设 检验 总 结 : 单 样本 情形 


8.80 工厂 投入 产 出 比 . 参考 例 8. 14, 工厂 采用 电力 和 
可 燃气 体 两 种 能 源 效用 的 比较 研究 . 下 表 分 别 给 出 11 
家 采用 电力 能 源 工厂 的 投入 产 出 比 和 16 家 采用 可 燃 
气体 能 源 工厂 的 投入 产 出 比 . 用 自助 法 检验 采用 这 两 
种 能 源 的 工厂 的 平均 投入 产 出 比 是 否 存 在 差异 . 

电力 204.15 0.57 62.76 89.72 0.35 85.46 
0.78 0.65 44.38 9,28 78.60 
可 燃气 体 0.78 16.66 7494 0.01 0.54 23.50 88.79 0.64 
0.83 91.84 7.20 66.64 0.74 64. 67165. 60 0.36 


8.81 月 球 土壤 研究 . 参考 练习 8. 54, Meteoritics (1995 
年 3 月 ) 关 于 月 球 土壤 进化 的 研究 . 有 一 条 理论 认为 
月 球 兰 心底 部 土壤 样本 被 尘土 和 火山 玻璃 碎片 包 壳 
颗粒 的 比率 小 于 0.5. BE p 的 先 验 分 布 是 参数 为 
a=1, B=2 的 6 概 率 分 布 . 对 感 兴趣 的 假设 进行 由 
叶 斯 检验 .〈 注 : 由 练习 8.54 可 知 , 81 BH SR Su 
底部 颗粒 的 样本 中 有 29 颗 是 包 壳 的 . ) 

理论 练习 

8.82 ZHy.».»,.--, y, 表示 从 均值 和 未 知 的 泊 松 
概率 分 布 中 选取 的 一 个 容量 为 n 的 随机 样本 . S x 3€ 
示 泊 松 值 之 和 X = 三 7 ， 则 无 服从 均值 为 nA 的 泊 松 分 
布 . 假定 À 的 先 验 分 布 是 参数 为 6 的 指数 概率 分 布 . 求 
HIE Ho: A = À XJ H,: À > Av 的 贝 叶 斯 决策 规则 ( 提 
示 : 利用 练习 7. 94 得 到 的 后 验 分 布 g(A | z). ) 

8.83 Hy.» x.» EARE u 和 已 知 
方差 ?=1 的 正 态 概率 分 布 中 选取 的 一 个 容量 为 
的 随机 样本 , 则 样本 均值 服从 均值 为 ,方差 为 
P =1/n 的 正 态 分 布 . 假定 的 先 验 分 布 是 均值 为 
5, 方差 为 1 的 正 态 分 布 . 求 检验 h: L 7 uo XJ H,: 
4. « uo 的 贝 叶 斯 决策 规则 . (提示 : 利用 练习 7. 95 
得 到 的 后 验 分 布 , g( | y). ) 





参数 (8) MBC) 点 估计 ( 0) 检验 统计 量 样本 容量 附加 的 假定 
_ = -YA Y 7 Ho > 
m =H y fU vn n=30 X 
p Jue n «30 正 态 总 体 


其 中 的 自由 度 为 v= (n - 1) 
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( 续 ) 
参数 (9) RBR) 点 估计 (全 检验 统计 量 样本 容量 附加 的 假定 
_ un" z= Ë =P n 足够 大 使 得 
, Pm $e p n4 Hoja 
2 2 2 2 _(n-1)s 
a? 0 =o E x = oi 所 有 nn 正 态 总 体 
其 中 好 的 自由 度 
为 v= (n — 1) 
假设 检验 总 结 : 两 样本 情形 
人 参数 (0) BRE (HS) 点 估计 ( 0) 检验 统计 量 样本 容量 附加 的 假定 
(aa ~p) (m 795) = Do (y 一 为) -2 SR) fe n, 230, n, 230 无 
独立 样本 (如 果 要 发 现 司 
Hi 和 jw 的 不 
同 , 则 Do =0. ) Ui -») -Do -- m 
n st si 
1,2 
n nj 
T= (71 -%) -Do n, <30 或 n, «30 两 个 正 态 总 体 
3( 志 + 二 ) 或 者 nl 和 ns 都 小 具有 相等 的 方差 
mom 于 30 (ai 202) 
PER TAARE CERETI 
本 见 8.7 节 框 格 中 
2 Q9 - Ds +(m -Ds 的 修正 ) 
Ln nj +n, -2 T 
Ka = Ka = Do (WREE l= È;-1d;/n T= d - D, 所 有 ns (如 果 na 之 25 d, 的 总 体 服从 
Gn -Ha) ， 现 jn fla 的 不 样本 差 的 均值 5a/ Vng 30, 可 以 应 用 标准 正 ESAM 
配对 同 , WJ D, =0. ) 其 中 了 的 自由 度 为 态 (z) 检 验 . ) 
v= (na -1) 
(pi -ps) (pi - p.) = Do (p. -P) 对 于 Do =0: n fli n, 都 足够 大 ， 独立 样本 
(如 果 要 发 现 bi Z= (Py 7 P3) 使 得 nidi 4, 
和 ps 的 不 同 , 则 Pafii) mg 24 H mb, >4, 
D, =0. ) 2 ^ 
a ty m d 24 
其 中 ni +n 
对 于 D, #0 
Z- (P1 -P2) -Do 
hif RA q 








ni n; 
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(E) 
参数 (9) BRC) — 点 估计 (全 检验 统计 量 样本 容量 附加 的 假定 
ei ei 5 ;，、2 po PAm Ñn, 来 自 正 态 总 体 
E x^ x Ma >e: F= 的 独立 随机 样本 


9? 


H,: o? xg; 

站- 较 大 的 方差 
较 小 的 方差 2 

其 中 下 基于 

2 = 分 子 自由 度 和 

v; 二 分 母 自由 度 


符号 读 法 说 H 








“T 
Ho h-o 原 假 设 
H, h-a 备 择 假 设 
a alpha I 型 错误 的 概率 
B beta 工 型 错误 的 概率 
bo theta $ H 中 总 体 参数 的 假设 值 
Ho mu 零 Ho 中 总 体 均值 的 假设 值 
D, da Ho 中 总 体 差 的 假设 值 


02 sigma- Z3 Jr H, 中 总 体 方差 的 假设 值 
TM 


本 章 简 要 提示 


假设 检验 的 要 素 : 原 假设 、 备 择 假设 、 检验 统 计量 、 显著 性 水 平 (ae) 、 拒 绝 域 、p 值 和 结论 . 
假设 检验 中 两 种 类 型 错误 :I 型 错误 ( 当 H, 为 真 时 却 拒绝 H.) 、f 型 错误 ( 当 H; 非 真 时 却 接 
5 Ho). 

错误 概率 : a = 了 P( I 型 错误 ) = POEH H, | H, HA), B =P( I 型 错误 ) = P( 接 受 Ho | Ho 
ER). 

备 择 假设 的 三 种 形式 : 下 侧 检验 ( < ) 、 上 侧 检 验 ( > ) 、 双 侧 检验 ( 9€). 

观测 的 显著 性 水 平 (p 值 ) 是 用 于 拒绝 原 假设 的 最 小 a f. 

拒绝 H, 的 决策 准则 :(1) 检 验 统计 量 落 人 拒绝 域 中 , 或 者 ， (2)p 值 <a. 

检验 的 功效 =1 -B=P( 拒 绝 H, | H IEE). 

认为 是 感 兴趣 参数 的 关键 词 是 ; 均值 、 平 均 . 

认为 Ai -pz 为 感 兴趣 参数 的 关键 词 /短语 是 : 均值 或 平均 的 差 、 利 用 独立 样本 比较 两 个 
均值 . 

认为 wu 为 感 兴趣 参数 的 关键 词 /短语 是 : 配对 差 的 均值 或 平均 、 利 用 配对 样本 比较 两 个 
均值 . 


假设 检验 
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认为 为 感 兴趣 参数 的 关键 词 是 : 比率 、 百 分 比 、 比 . 


° 认为 p1 -P 为 感 兴趣 参数 的 关键 词 /短语 是 : 两 个 比率 或 百分数 的 差 、 利 用 独立 样本 比较 两 


个 比率 . 


° 38 o? 为 感 兴趣 参数 的 关键 词 是 ; 方差 、 散 布 、 变 异 . 


变异 . 

补充 练习 

8.84 ZENEK. Journal of Biogeography ( 2003 
年 12 月 ) 发 表 了 一 项 关于 蒙古 (中 亚 ) 蚂 蚁 的 研究 . 
植物 学 家 分 别 在 干枯 草原 地 区 5 个 地 点 和 戈壁 沙 
漠 地 区 6 个 地 点 放置 了 种 子 诱饵 , 并 观察 每 处 吸引 
昭 蚁 种 类 的 数量 , 数据 列 于 下 表 . 是 否 存在 证 据 表 
明 在 这 两 个 蒙古 地 区 发 现 的 蚂蚁 种 类 的 平均 数 存 
在 差异 ? 利用 a =0. 05 得 出 合适 的 结论 . 








地 点 地 区 蚂蚁 种 类 数 
1 干枯 草原 3 
2 干枯 草原 3 
3 于 枯草 原 52 
4 干枯 草原 7 
5 干枯 草原 5 
6 戈壁 沙漠 49 
7 戈壁 沙漠 5 
8 戈壁 沙漠 - 4 
9 戈壁 沙漠 4 
10 戈壁 沙洲 5 
11 REWA 4 


资料 来 源 : Pfeiffer, M. , 


species richness of ants in Mongolia along an ecological gradi- 


et al. " Community organization and 


ent from steppe to Gobi desert. " Journal of Biogeography , 
Vol. 30, No. 12, Dec. 2003. 


-85 蒙古 沙漠 蚂蚁 ( 续 ). 参考 练习 8. 84, Journal of 
Biogeography( 2003 年 12 月 ) 关于 蒙古 (中 亚 ) 蚂 蚊 
的 研究 ， 比 较 了 两 个 沙漠 地 区 蚂 蚊 的 平均 种 类 数 . 
由 于 样本 容量 小 , 为 了 推断 的 有 效 性 , 两 个 地 区 的 
总 体 方差 必须 相等 . 

a. 为 确定 方差 是 否 相 等 , 建立 原 假设 H, 和 备 择 假 
i H,. 

b. 利用 GOBIANTS 文件 中 的 数据 求 此 检验 的 检验 
统计 量 . 

c. 如 果 a =0.05, 给 出 检验 的 拒绝 域 . 


认为 o1/o; 为 感 兴趣 参数 的 关键 词 / 短 语 是 : 方差 间 的 不 同 、 利 用 独立 样本 比较 两 总 体 的 


d. 求 检验 的 近似 p 值 . 
e 对 问题 做 出 适当 的 结论 . 
f 为 了 使 检验 结果 是 有 效 的 , 需要 什么 条 件 ? 


8.86 大 学 期 间 变 换 专 业 . 当 女 大 学 生 从 科学 、 数 学 


Oo 


和 工程 (CSME ) 专业 转 到 非 理科 专业 时 ,她们 的 理 
由 与 男生 相同 吗 9 Science Education ( 1995 年 7 月 ) 
曾经 对 这 个 问题 进行 过 调查 研究 . 335 名 低 年 级 / 

高 年 级 的 大 学 生 样 本 , 其 中 女生 172 名 , 男生 163 

名 , 他 们 都 是 来 自 两 所 大 型 研究 型 大 学 换 专业 的 

学 生 , 也 就 是 说 他 们 从 一 个 SME 专业 转 到 一 个 非 

SME 专业 . 每 个 学 生 列 出 了 他 们 决定 换 专 业 的 一 个 

或 多 个 理由 . 

a. 172 名 女生 中 , 有 74 名 认为 对 SME 缺乏 或 没有 
兴趣 是 换 专业 的 主要 原因 ,而 163 名 男生 中 有 
72 名 具有 相同 的 观点 . 检验 (a =0.10) 女 生 对 
SME 缺乏 兴趣 是 换 专业 主要 原因 的 比率 是 否 与 
男生 的 比率 不 同 . 

b. 172 名 女生 中 有 33 名 表示 由 于 她 们 在 早年 学 习 
中 SME 的 成 绩 低 而 泄气 或 失去 了 信心 , 在 163 
名 男生 中 44 名 有 相同 的 情况 . 对 由 于 SME 低 分 
数 而 失去 信心 的 男女 生 比 率 的 差 构 造 90% 置信 
区 间 . 并 对 结果 加 以 解释 . 


.87 ”比较 文字 处 理 器 . 假定 想 确定 数据 处 理 器 用 户 


是 否 对 文字 处 理 器 A 和 B 有 所 偏爱 . 如 果 用 户 对 这 
两 个 文字 处 理 器 没有 偏好 ( 即 如 果 这 两 个 系统 是 相 
FR), 那么 用 户 喜 欢 系 统 A 的 概率 是 p =0.5. 令 
了 表示 10 名 用 户 的 样本 中 喜欢 系统 A 的 人 数 , 假 
定 想 检验 也 :pp=0.5 X4 H, 240.5. 一 个 可 能 的 检验 
方法 是 , WR Y=1 或 Y=8, H^ H. 

a. 求 此 检验 的 a. 

b. WR p 20.4, R B, 检验 功效 是 多 少 ? 

c. 如 果 p =0. 8, 求 B, 检验 功效 是 多 少 ? 


.88 检测 纸张 亮度 . 造纸 公司 的 质量 控制 部 门 全 天 


定期 检测 生产 出 的 纸张 亮度 (一 种 反射 系数 度量 ). 
用 于 检测 纸张 样品 的 两 台 设 备 有 些 误差 , 但 是 可 
以 通过 调节 使 控制 纸张 样品 的 平均 读数 相同 . 假定 
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所 关心 的 是 两 台 设备 的 精度 , 即 设备 2 的 精度 低 于 
设备 1. 为 了 验证 这 一 观点 ,用 两 台 设备 分 别 检测 
同一 纸张 样本 5 次 , 数据 列 于 下 表 . 数据 是 否 提供 
了 充足 的 证 据 表明 设备 2 的 精度 低 于 设备 1? 利用 





a =0. 05 检验 . 
设备 1 设备 2 
29 26 
28 34 
30 ` 30 
28 32 
30 28 


-89 安排 轮胎 耐久 性 实验 . 某 轮胎 橡胶 公司 检测 部 


门 安排 卡车 和 客车 轮胎 耐久 性 实验 . 目前 , 利用 最 
短处 理 时 间 (SPT) 方 法 的 柔性 处 理 器 (可 以 处 理 卡 
车 或 客车 轮胎 的 机 器 ) 每 周 安排 两 次 检测 . 在 SPT 
方法 下 , 首先 安排 最 短处 理 时 间 的 轮胎 . 公司 的 研 
究 人 员 开发 了 一 种 新 的 安排 规则 ,他 们 相信 这 种 
新 规则 将 缩短 平均 流动 时 间 ( 即 检测 的 平均 完成 时 
间 ) 而且 也 可 以 减少 安排 试 检 的 平均 拖延 . 为 了 
比较 这 两 种 安排 规则 ， 随 机 选取 64 个 轮胎 并 分 成 
等 量 的 两 组 . 一 组 轮胎 用 SPT 安排 , 另 一 组 用 提议 
的 规则 . 下 表 给 出 了 轮胎 检验 的 流动 时 间 和 拖延 时 
间 ( 单 位 :*h). 








流动 时 间 拖延 时 间 
均值 方差 均值 方差 
SPT 158.28 8532.80 5.26 452. 09 
提议 方法 117.07 5208.53 — 4.52 319.41 


a 是 否 有 足够 的 证 据 (a = 0.05) 证 明 提议 的 安排 
规则 平均 流动 时 间 比 SPT 方法 少 ? 

b. 是 否 有 足够 的 证 据 (a =0.05) 证 明 提议 的 安排 
规则 可 以 减 小 轮胎 检测 的 平均 拖延 时 间 . 


“90 T 型 粱 的 承载 能 力 . 参考 练习 8.73, 关于 加 


辕 混凝土 了 型 梁 断 裂 实验 的 研究 . 将 实验 结果 与 
利用 预测 最 终 承 载 能 力 的 失效 表面 法 得 到 的 理 
论 结果 比较 . 下 表 给 出 了 6 根 平板 面 宽 度 为 40 
em 的 T 型 梁 实 际 和 理论 的 最 终 扭矩 , 检验 实验 
的 最 终 扭矩 均值 是 否 异 于 理论 的 最 终 扭矩 均 值 ， 
利用 o 20.05. 


œ 


T 型 染 1 2 3 4 5 6 
试验 结果 4.70 5.40 4.30 4.80 
理论 结果 4.63 
资料 来 源 : Zararis, P. D. , and Penelis, G. 


forced concrete T- beams in torsion and bending. ” Journal of 





5.20 5.40 


4.65 5.60 5.60 3.62 3.62 


, Jr. " Rein- 


the American. Concrete. Institute, Vol. 83, No. 1, Jan- Feb. 
1986, p. 153. 


. 91 放射 性 水 . 有 些 矿 物 在 开采 时 出 现 的 一 个 问题 


是 某 些 副产品 带 有 轻 度 放射 性 , 并 且 这 些 副 产品 

有 时 会 进入 饮用 水 供给 中 . 美国 环保 署 颁布 了 有 关 

条 例 , 规定 饮用 水 中 辐射 量 的 限度 . 特别 地 ， 自 然 

存在 的 放射 上 限 是 5 pCi/L. 从 某 城市 的 供水 中 选 

取 24 份 水 样品 的 随机 样本 ,得 到 样本 统计 量 了 = 

4. 61 pCi/L, s =0. 87 pCi/L. 

a. 这 些 数据 是 否 提供 了 充足 的 证 据 证 明 辐射 的 平 
均 水 平 是 安全 的 ( 低 于 美国 环保 署 规定 的 上 
FR)? 利用 a =0.01 检验 . 

b. Eat, 为 何 希望 利用 一 个 小 的 a f? 

c. HA p, =4.5 pCi/L, 计算 检验 的 B 值 . 

d. 计算 并 解释 此 检验 的 p 值 . 


92 过 热 的 温泉 . 泡 温泉 太 久 可 能 导致 过 热 , 对 于 


孕妇 来 说 , 可 能 引起 胎儿 畸形 . 但 是 多 长 时 间 算 太 
AR? 几 位 研究 者 根据 他 们 在 这 个 领域 的 工作 , 假 
设 女性 浸泡 在 40% 的 温泉 中 ,， 当 外 耳 道 ( 核 心 ) 的 
温度 达到 40C 时 ,有 75% 的 女性 会 感到 不 适 . 因 
此 , 建议 将 这 种 主观 不 舒服 当 作 一 项 可 能 避免 过 
热 的 安全 措施 . 这 一 发 现 显 然 与 澳大利亚 的 一 项 研 
究 相 矛盾 . 这 项 研究 以 24 名 健康 且 未 怀孕 的 女性 
为 研究 样本 (New England Journal of Medicine, 1990 
年 9 月 20 H), 当 核心 温度 达到 40C BF, 24 名 女 
性 中 只 有 11 名 (46% ) 感到 热 得 不 舒服 . 检验 如 下 
假设 : 对 健康 的 未 怀孕 女性 , 核心 温度 达到 40 所 时 
域 到 不 适 地 热 的 真实 百分数 低 于 7595. a =0. 10. 


98 和 鱼 的 污染 . 参考 美国 陆军 工程 兵团 曾 对 田纳西 


河 ( 亚 拉巴 马 州 ) 的 鱼 污染 问题 进行 的 研究 . 

a 利用 随机 数 表 ( 表 B. 1) 从 DDT 文件 中 产生 = 
40 个 鱼 的 DDT 浓度 观测 值 的 随机 样本 . 计算 样 
本 观测 值 的 7 RI s. 

b. 食品 和 药物 管理 局 规定 每 条 鱼 中 的 DDT 含量 不 
得 超过 百 万 分 之 五 (5 ppm). a 中 的 样本 是 否 提 
供 了 充分 的 证 据 表 明 栖 居 在 田纳西 河 及 其 支流 
的 每 条 鱼 的 平均 DDT 含量 超过 5 ppm? 利用 显 
著 性 水 平 a =0. 01 检验 . 


假设 检验 
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Co 


c. 假定 b 中 的 假设 检验 是 基于 只 有 =8 条 鱼 的 随 
机 样本 , 这 种 小 样本 检验 的 缺点 是 什么 ? 

d. 重复 b 中 只 利用 8 条 鱼 DDT 含量 的 信息 (从 a 
的 40 个 观测 值 中 随机 选取 ). 比较 大 样本 和 小 
样本 检验 的 结果 ， 


.94 滚珠 轴承 规格 , 在 机 械 制 造 业 中 , 使 零件 满足 


规格 要 求 是 十 分 必要 的 . 过 去 某 厂商 生产 的 滚珠 轴 
承 直径 的 方差 是 0.00156. 为 了 降低 成 本 , 厂商 提 
出 一 个 减少 费用 的 生产 方法 . 从 新 方法 生产 的 轴承 
中 随机 抽取 100 个 , 直径 的 方差 是 0.00211. 数据 
是 否 提 供 了 充分 的 证 据 表 明 新 方法 生产 的 滚珠 轴 
承 直径 比 原 方法 具有 更 大 的 变异 ? a =0. 05. 


.95 空气 离子 平衡 . 如 果 一 个 房间 的 正 离子 浓度 过 


高 将 引起 居住 者 疲劳 、 有 压力 和 呼吸 困难 的 问题 . 
但 研究 表明 在 房间 的 空气 中 引入 附加 的 负离子 ( 通 
过 负离子 发 生 器 ), 加 上 经 常 通风 ， 从 而 保持 空气 
离子 平衡 有 助 于 人 的 健康 . 曾 进行 过 这 样 一 项 实 
验 , 在 某 大 型 工厂 中 随机 挑选 100 名 员工 , 并 分 为 
两 组 , 每 组 各 50 人 . 告诉 两 组 员工 他 们 工作 的 环 
境 是 通过 负离子 发 生 器 来 控制 离子 平衡 的 . 然而 员 
工 并 不 知道 ,只 开启 实验 组 工作 地 点 的 发 生 器 , 一 
天 结束 后 , 记录 每 一 组 员工 感到 偏 头痛 、 疲劳 、 豪 
弱 或 者 其 他 身体 不 适 的 人 数 ,结果 列 于 下 表 . 


实验 组 


(离子 发 生 器 开 ) 
n, =50 





控制 组 


(离子 发 生 器 关 ) 
n, =50 








样本 容量 
样本 中 感到 某 类 
身体 不 适 的 人 数 3 12 


a 执行 假设 检验 确定 一 天 结束 时 实验 组 中 感到 某 
种 身体 不 适 的 员工 人 数 比 率 是 否 显 著 地 低 于 控 
制 组 的 比率 . 利用 显著 性 水 平 a = 0. 03. 

b. 计算 此 检验 的 p fE. 


.96 黄蜂 的 同系 繁殖 . 参考 练习 7.98, Science 


(1988 年 11 月 ) 关 于 热带 黄蜂 群 同系 繁殖 的 研究 . 

将 197 只 捕捉 到 的 黄蜂 样本 冷冻 , 并 且 进 行 一 系列 

基因 检验 得 到 样本 同系 繁殖 系数 均值 7 = 0. 044， 

标准 差 s=0. 884. 如 果 黄 蜂 没 有 同系 繁殖 趋势 , 真 

实 的 同系 繁殖 系数 应 该 等 于 0. 

a. 检验 这 种 黄蜂 的 真实 同系 繁殖 系数 均值 超过 
0 的 假设 , 利用 a =0. 05. 

b. 将 a 的 推断 与 练习 7. 98 应 用 置信 区 间 得 到 的 推 
BRER, 二 者 是 否 一 致 ?解释 原因 . 


8. 


Co 


97 公用 杆 的 强度 . 下 表 给 出 了 用 于 公共 事业 的 两 
种 木 制 杆 强 度 (在 地 平面 的 断裂 模 数 , 单位 : lb/ 
in^) 的 均值 和 标准 差 . 数据 是 否 提 供 了 充分 的 证 据 
证 明 由 沿岸 道格拉斯 冷杉 和 南部 松木 制 成 的 木 杆 
强度 方差 存在 差异 ? a = 0. 02. 





种 类 样本 容量 ”样本 均值 ” 样本 标准 差 
沿岸 道 格 
RINE 118 8 380 644. 62 
南方 松 147 8 870 611. 72 


资料 来 源 : Goodman. J. R. , Vanderbilt, M. D. , and Cri- 
swell, M. E. "Reliability- based design of wood transmission 
line structures. " Journal of Structural Engineering , Vol. 109, 
No. 3, 1983, p. 690-704. 


.98 煤 焦油 蒸汽 压力 . 二 莽 类 似 于 在 煤 焦 油 中 发 现 


的 杂 环 芬芳 化 合 物 , 下 表 给 出 了 一 葵 蒸 汽 压力 的 

理论 (计算 ) 值 和 试验 值 . 如 果 燕 汽 压 力 的 理论 模 

型 是 一 个 实际 的 好 模型 , 那么 对 于 给 定 的 温度 , 试 

验 值 与 计算 值 的 真实 平均 差 将 会 等 于 0. 

a. 数据 是 否 提供 了 充分 的 证 据 表 明 平均 差 不 为 0? 
利用 a =0. 05 检验 . 

b 计算 并 解释 检验 的 p 值 . 











TUR JJ 

i ECC) 试验 值 计算 值 
100. 60 0. 282 0. 276 
101. 36 0. 314 0. 307 
104. 60 0.335 0.350 
106. 44 0. 404 0. 390 
108. 70 0. 422 0. 444 
110. 96 0. 513 0. 505 
112. 62 0. 554 0. 554 
115.21 0. 642 0. 640 
116. 69 0. 669 0. 695 
119. 38 0. 834 0. 805 
121. 08 0. 890 0. 882 
123. 61 1.01 1.01 
124. 90 1.07 1.08 
127. 74 1.26 1.25 
130. 24 1.42 1. 43 
131. 75 1.55 1.54 


资料 来 源 ; Edwards, D. R. 


Pressures of some sulphur- containing, coal- related com- 


, and Prausnitz, J. M. "Vapor 


pounds." Journal of Chemical and Engineering Data, Vol. 
26, 1981, p. 121-124. 版 权 归 属于 美国 化 学 学 会 . 转 印 须 
经 许可 . 
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.99 ”螺栓 直径 . 某 机 器 生产 平均 长 度 为 1 in 的 螺 
栓 , 太 长 或 太 短 的 螺栓 都 不 能 满足 客户 的 要 求 并 
且 会 退回 . 为 了 避免 生产 太 多 的 不 合格 品 , 对 生产 
出 的 螺栓 要 随时 抽样 并 进行 检验 , 从 而 判断 机 器 
是 否 正常 运行 , 即 生产 的 螺栓 平均 长 度 是 1 in. 假 
设 抽样 50 个 螺栓 , y 21.02 in, s 20.04 m. 样本 是 


次 使 用 藏 物 处 . 在 每 一 个 用 笼 掩护 的 藏 物 处 附近 建 
立 一 个 笼 控制 区 ,观测 藏 物 处 和 控制 区 域 秧苗 发 
芽 的 数量 , 下 表 给 出 了 数据 摘要 . 是 否 有 充分 的 证 
据 (a=0.05) 表 明 老 鼠 种 子 藏 物 处 秧苗 发 芽 的 平均 
数量 显著 地 大 于 控制 区 域 的 相应 平均 数量 ? 





否 表明 机 器 生产 的 螺栓 平均 长 度 不 等 于 l in, 即 生 =a EM 
产 过 程 失控 ? 利用 a =0. 01 检验 . -53 元 -2.7 
. 100 ”奶牛 的 热 紧张 . IFAS 乳品 研究 单位 和 佛 罗 里 s 13 s =0.7 


达 大 学 农业 工程 系 的 研究 人 员 开 发 了 搭建 谈 戎 建筑 
物 的 设计 标准 , 他 们 认为 这 种 遮 基 。 建 筑 物 可 以 帮助 
奶牛 缓解 热 紧 张 . 在 一 项 实验 中 , 31 头 怀 有 3 个 月 
身孕 的 荷兰 奶牛 被 分 成 两 组 ，16 头 奶 牛 生活 在 遮 荫 》 
建筑 物 中 , 剩 下 的 15 AMRA RHEA. 研究 人 
员 记 录 了 每 头 奶牛 产 仔 后 100 天 的 产 奶 量 (单位 : 
lb) ， 下 表 给 出 了 两 组 奶牛 的 平均 产 奶 量 . 是 否 有 充 
分 的 证 据 表明 生活 在 有 、 无 遮 荫 建筑 物 的 两 组 奶牛 
的 平均 产 奶 量 存在 差异 ? 利用 a =0. 10.〈 假 定 两 组 
奶牛 产 奶 量 的 标准 差 都 等 于 40 lb. ) 





8 


资料 来 源 : Reichman, O. J. * 
its impact on seed densities and distributions. " Ecology, Dec. 
1979, Vol. 60, p. 1085-1092. 版 权 归 属于 美国 生态 协会 . 
转 印 须 经 许可 . 


Desert granivore foraging and 


.102 光照 研究 . 参考 练习 7. 48, Journal of Environ- 


mental Engineering( 1986 年 2 月 ) 关 于 污水 处 理 净 
化 器 冬季 热 损 失 的 研究 . 下 表 给 出 的 数据 用 于 比较 
中 西部 两 个 地 区 晴天 全 天 太阳 辐射 水 平均 值 ( 单 
位 : BTU/f”). 进行 比较 均值 的 假设 检验 . 并 解释 
结果 a = 0. 05. 








sx" TEN H 期 3 AE X B 

样本 容量 16 15 一 一 一 
均值 367.4 330.8 12 H21H 782 593 
资料 来 源 :“Minimizing heat stress for dairy cows. ” Florida Ag- | M M u " NA 
ricultural Research 83, Vol. 2, No. 1, Winter 1983, p. 10-13. 2H6H 1181 988 
8.101 种 子 密度 分 布 研究 . 进行 一 项 田间 试验 , 确 2 月 21 日 1414 1226 
定 食 谷 动物 ( 食 种 子 ) 对 土壤 中 种 子 密度 和 分 布 的 3 月 7 日 1 633 1 462 
影响 . 因为 某 些 老鼠 把 种 子 储藏 在 地 表 藏 物 处 ,所 3 月 21 日 1 852 1 698 


以 设计 特殊 的 研究 方案 来 确定 这 些 地 表 藏 物 处 最 
终 乎 均 能 比邻 近 控制 区 域 长 出 更 多 的 秧苗 . 标记 40 
个 老鼠 挖掘 的 小 区 域 , 并 用 塑料 笼 掩 护 以 防老 鼠 再 


资料 来 源 : Wall, D. J., 


heat loss in uncovered clarifiers. " 


and Peterson, G. " Model for winter 
Journal of Environmental 


Engineering, Vol. 112, No. 1, Feb. 1986, p. 128. 


活动 中 的 统计 学 :比较 溶解 药片 方法 一 一 溶解 方法 等 效 性 检验 

在 制药 工业 中 , 质量 工程 师 负责 保持 生产 过 程 中 生产 出 来 的 药品 质量 . 质量 的 关键 是 通过 对 感 兴 
趣 变 量 反复 测量 , 对 药品 特性 的 评价 . 当 变量 是 混合 物 中 某 一 要 素 的 浓度 时 , 这 个 过 程 称 为 检定 . 在 本 
章 活 动 中 的 统计 学 , 我 们 关心 的 化 学 检定 是 确定 固体 剂量 药物 (如 一 片 阿司匹林 或 胶 圳 ) 溶 解 有 多 快 . 
由 于 药物 溶解 的 变异 对 病人 会 产生 有 害 的 副作用 , 所 以 质量 检查 员 需 要 精确 地 度量 药物 溶解 性 . 

在 “溶解 方法 等 效 性 ”问题 上 (统计 案例 研究 : 学 术 与 工业 之 间 的 协作 ,ASA-SIAM 统计 与 应 用 概 
率 从 书 , 1998 的 第 4 章 . ), 统计 学 家 Russell Reeve 和 Francis Giesbrecht 探索 了 由 著名 制药 公司 生产 
的 一 种 新 型 速溶 药品 的 溶解 特性 . 一 种 速溶 产品 设计 为 尽快 溶解 并 进入 血 流 中 . 为 了 检验 固体 剂量 
药物 的 溶解 , 公司 采用 一 种 带 有 6 个 容器 或 试管 的 仪器 , 每 个 试管 中 装 有 溶液 . 把 药片 或 胶囊 放 在 试 
ET, 然后 在 预定 时 刻 ， 从 每 个 试管 中 提取 少量 溶液 , 利用 高 性 能 液体 色谱 ( HPLC) 进行 分 析 . 
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HPLC 可 以 量化 溶液 中 药物 的 含量 , 这 个 值 用 标识 浓度 的 百分数 表示 ( 96 LS). 

最 初 , 这 种 方法 只 是 在 公司 研发 中 心 的 试验 室 使 用 , 一 旦 药物 的 溶解 认为 是 符合 要 求 的 , 那么 
这 种 方法 转移 到 制造 车 间 . 然而 联邦 法 规 要 求 在 制造 现场 的 质量 检查 员 给 出 这 种 试验 结果 与 研发 中 
心 的 结果 具有 等 效 性 . 实际 上 , 公司 必须 提供 相关 文件 来 证 明 进 行 溶解 试验 任意 两 个 现场 得 到 的 检 
定 结果 是 等 效 的 . 

K SIA8. 1 给 出 了 在 两 个 制造 地 (新 泽 西 州 和 波多 黎 各 ) 进行 止痛 片 溶解 试验 的 数据 . (数据 保存 
fr DISSOLVE 文件 中 . )6 个 容器 中 的 % LS 值 分别 在 4 个 不 同时 间 点 : 20 min 后 、40 min 后 60 min 后 
和 120 min 后 测 得 . 根据 这 些 样本 数据 ,两 个 地 方 得 到 的 是 等 效 的 检定 结果 吗 ? 

X SIA8. 1 溶解 试验 数据 {百分比 标识 浓度 ) 





地 点 时 间 (min) 试管 1 试管 2 试管 3 试管 4 试管 5 试管 6 
新 泽 西 州 20 5 10 2 7 6 0 
40 72 79 81 70 72 73 

60 96 99 93 95 96 99 

120 99 99 96 100 98 100 

波多 黎 各 20 10 12 7 3 5 14 
40 65 66 71 70 74 69 

60 95 99 98 94 90 92 

120 100 102 98 99 97 100 





资料 来 源 : Reeve, R. , and Giesbrecht, F. “Dissolution Method Equivalence. " Statistical Case Studies: A Collaboration between Academe 
and Índustry, eds. R. Peck, L. Haugh, and A. Goodman. ASA-SIAM Series on Statistics and Applied Probability, 1998( 25 4 E£, #4). 


解决 这 个 问题 最 初 比较 好 的 方法 是 检验 两 个 现场 % LS 测量 值 的 平均 是 否 存在 差异 . 令 u 表示 
新 渗 西 州 试验 的 总 体 %LS 均值 , js 表示 波多 黎 各 试验 的 总 体 % LS 均值 . 如 果 两 个 现场 试验 结果 具 
有 等 效 性 , IA u =m. 原 假设 和 备 择 假设 可 以 记 作 : 

Ho: Qu -u2) =0( 即 溶解 等 效 ) 
H,: (pi -J2) 天 0( 即 不 等 效 ) 

为 了 简化 分 析 , 统计 学 家 建议 溶解 试验 分 别 对 4 个 时 间 段 的 每 一 个 进行 . 在 每 个 时 间 点 应 用 SAS 
进行 检验 , 结果 列 于 图 SIAS. 1. 溶解 时 间 为 20, 40, 60 和 120 min 双 侧 检验 的 p 值 (输出 中 着 重 显示 ) 
分 别 为 0. 1528, 0. 0395 , 0. 3499 和 0. 4956. "in SEXE gU. T 型 错误 的 概率 a =0.05, 那么 对 于 4 个 时 间 
点 中 的 3 个 我 们 不 能 拒绝 H (p f >0.05), 只 有 在 溶解 时 间 为 40 min 的 试验 中 , 有 充分 的 证 据 表明 
两 个 现场 的 平均 % LS 值 存在 差异 . 换 句 话说 , 可 以 从 假设 检验 中 合理 地 得 到 这 样 的 结论 : 当 溶解 时 
间 为 20, 60 和 120 min 时 , 两 个 现场 的 试验 具有 等 效 性 , 但 是 对 于 溶解 时 间 为 40 min 的 试验 , 没有 得 
到 具有 等 效 性 结果 . 

正如 统计 学 家 在 书 中 警告 , 这 种 假设 检验 方法 需要 有 -一些 避免 误解 的 说 明 . 首先 , 检验 中 等 效 的 思 
想 由 “接受 所 "来 建立 . 记得 结论 “接受 Ho" WEEN B = POIL 型 错误 ) = P( 接 受 H, | H) 是 错误 ) 来 度 
E. 在 这 个 应 用 中 , B 是 当 两 个 均值 实际 上 不 等 , 却说 Ai = 的 概率 . 由 于 当 备 择 条 件 jp xp, 为 真 时 ， 
pa, -/ 的 抽样 分 布 是 未 知 的 , 所 以 8 的 精确 值 也 未 知 . 其 次 , 在 这 个 假设 检验 中 ,“ 实 际 显著 性 概念 被 
忽略 了 . 也 就 是 说 , 虽然 总 体 均值 在 统计 意义 上 (a =0.05) 存 在 差异 , 但 是 二 者 真实 的 差异 可 能 很 小 ， 
在 实际 中 不 认为 是 有 意义 的 不 同 . 最 后 , 可 能 会 惩罚 有 较 小 %LS 方差 (小 于 平均 ) 试 验 站 点 的 不 利 影响 . 
可 以 通过 检查 8.7 节 检 验 统计 量 的 公式 看 出 这 一 点 . 当 样本 均值 的 差 除 以 一 个 较 小 的 标准 误 ( 如 果 一 个 
现场 的 方差 较 小 时 , 将 可 能 发 生 这 种 情况 ) 时 , 得 到 的 i 值 将 会 较 大 (因而 可 能 是 显著 的 ). 


316 


W 


E 








-----_ ----- TIME = 20 -- 





Sample Statistics 





Group N Hean Std. Dev Std. Error 
New Jersi e» | 6 waw s 3.5777 1.4606 
Puerto Rico s 8.5 4.2308 1.7272 
Hypothesis Test 

Null hypothesis: Mean 1 - Mean 2 = ọ 
Alternative: Mean 1 - Mean 2 ^- 0 

t statistic Df Pr >t 
Equal 7 -1.547 10 0.1528 
Not Equal -1.547 3.73 0.1537 


39X Confidence Interval for the Difference between Tuo Means 


Lower Limit Upper Li 


it 








Group N "eo 








New Jersey 5 T4.5 4.4159 1.8028 

Puerto Rico € 69.16667 3.3116 1.352 
Hypothesis Test 

Null hypothesis: Mean 1 ~ Mean 2 = 0 

Alternative: Mean 1 - Mean 2 “= 0 

If Variances fire t statistic Df Pr xt 





30X Confidence Interval for the Difference between Two Means 


Lower Li 





Upper Limit 


S 96.33333 
6 94:66667 





Hypothesis Test 


Nul! hypothesis: Mean 1 - Mean 2 = 0 
Alternative: Mean 1 - Mean 2 ^= 0 


Are t statistic 





New Jersey 6 38.65665 1.5055 9.6146 
Puerto Rica 5 S3,33333 1.7512 0.7149 


Hypothesis Test 






Null hypothesis: Mean 
Alternative: Mean 


If Variances fire 







Not Equal -0. 
30% Confidence Interval for the Difference between Two Means 
Lower Limit 














图 SIA8. 1 SAS 的 溶解 等 效 性 假设 检验 
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为 了 克服 这 些 问 题 , 制药 公司 提出 其 他 的 方法 来 解决 等 效 性 问题 . 统计 学 家 在 书 中 建议 的 一 种 方 





法 是 , BIOR u -js 的 90% 置信 区 间 . 如 果 平 X SIA8. 2 确定 溶解 等 效 性 

H% LS 值 差 的 置信 区 间 在 公司 规定 的 等 效 范围 ” 如果 平 均 %1S 如 果 均 值 差 在 以 下 范围 内 存在 溶解 等 效 
内 , 那么 就 认为 两 个 现场 的 检定 具有 等 效 性 . 在 <90% -15% - 15% 
实际 应 用 中 , 公司 利用 表 SIA8. 2 中 的 等 效 限 . 值 >90% -1% ~7% 


得 注意 的 是 ,界限 取决 于 平均 % LS 的 大 小 . 

利用 表 SIAS. 2 中 的 等 效 限 , 我 们 接受 两 个 现场 检定 等 效 的 条 件 是 如 -ju BJ 90% 置信 区 间 : (a) 
当 平均 %IS 小 于 90 时 , 落 在 -15 ~15 之 间 , 或 者 (b) 当 平 均 % LS 大 于 等 于 90 BF, 3E E 7 — 7 之 
间 . 注意 ,这 种 方法 与 下 面 的 假设 检验 (对 于 均值 <90% 的 检定 ) 是 等 价 的 ; 

Ho: (ji -p45) < -15 或 (Ai -Ha ) >15( 即 不 等 效 ) 
H,: -15 < (jp - u5) <15( 即 溶解 等 效 ) 
因此 , 这 种 方法 称 为 两 个 单 侧 t 检验 (TOST). 

对 表 SIA8. 1 中 的 数据 应 用 TOST, ok p, -Ha 的 90% 置信 区 间 . 图 SIAS. 1 的 SAS 输出 中 给 出 了 
这 些 置 信 区 间 和 平均 % LS 值 . 4 个 时 间 点 的 置信 区 间 都 分 别 落 在 各 自 的 等 效 限 内 ( 即 对 于 20 和 
40 min 落 在 -15 ~15 之 间 , 对 于 60 和 120 min 落 在 -7~7 之 间 ). 因此 , 数据 支持 两 个 现场 在 所 有 4 
个 溶解 时 间 的 溶解 检定 等 效 性 . 

BRT, TOST 认为 是 制药 公司 生物 等 价 性 检验 的 标准 方法 , 并 且 被 工程 、 化 学 和 环境 科学 所 
广泛 接受 .“ Beyond the t test; Statistical Equivalence Testing” (Analytical Chemistry, 2005 年 6 月 1 
日 ) 给 出 了 关于 TOST 很 好 的 指导 . 作者 提供 了 TOST 样本 容量 的 确定 以 及 如 何 选 择 重 要 的 等 
效 限 . 


第 9 章 分 类 数据 分 析 


目标 ”描述 如 何 分 析 计 数 数据 , 这 些 数据 来 源 于 多 项 试验 中 试验 观测 的 分 类 . 
91 分 类 数据 和 多 项 概率 


在 第 7 章 和 第 8 章 中 , 我 们 讨论 了 如 何 对 单个 总 体 的 比率 进行 推 斯 . 回顾 总 体 比率 是 二 项 斌 
验 一 一 在 任意 一 次 试验 中 都 是 两 种 可 能 结果 之 一 发 生 的 试验 中 * 成 功 "的 概率 . 在 本 章 中 , 我 们 对 有 
上 种 可 能 结果 的 多 项 试验 的 未 知 概率 (或 比率 ) 推断 感 兴趣 ， 即 想 要 进行 关于 p, pos pi 的 推断 ， 
其 中 pi 是 出 现 第 i 种 结果 的 概率 , 并 且 pi +p ep, =1. (关于 多 项 试验 的 详细 讨论 见 4.7 节 . ) 

为 了 说 明 , 考虑 在 5 条 生产 线 A、B、C、D 或 E 上 生产 叶轮 的 电动 风扇 叶片 公司 , 假定 每 条 生产 
线 以 相同 的 速度 和 产量 生产 叶轮 . 在 103 个 不 合 ao 1 n=103 个 不 合格 叶轮 根据 生产 线 的 分 类 
格 叶轮 的 样本 中 , 15 个 由 生产 线 A 生产 , 27 个 由 一 一 一 一 一 一 一 一 一 一 一 一 一 








生 产 线 
生产 线 B 生产, 31 个 由 生产 线 C 生产 , 19 个 由 生 ñ " c 5 " 
产 线 D 生产 , 11 个 由 生产 线 玉 生产 ( 见 表 9. 1). i5 > " » T 


对 于 这 个 多 项 试验 , 共有 5 种 结果 或 者 分 类 , 每 
一 个 不 合格 品 属于 其 中 一 类 , 每 类 对 应 于 5 条 生产 线 之 一 . 

在 研究 中 需要 回答 的 实际 问题 是 5 条 生产 线 的 不 合格 叶轮 比率 是 否 存在 差异 . 数据 提供 了 与 原 
假设 Ho: pi =ps =… =ps 矛盾 的 证 据 吗 ? 其 中 p, 是 第 i 条 生产 线 生 产 的 不 合格 品 比率 . 如 果 表 9. 1 
中 的 数据 与 假设 矛盾 , 生产 商 想 了 解 为 什么 某 些 生产 线 的 不 合格 产品 比率 大 于 其 他 生产 线 ,， 并且 要 
采取 措施 减少 不 合格 产品 . 

本 章 主要 研究 分 类 数据 , 特别 地 , 研究 表示 多 项 试验 中 每 一 个 类 型 计数 的 数据 分 析 . 在 9.2 节 和 
9.3 节 中 , 我 们 将 要 学 习 如 何 对 根据 单个 定性 (或 类 型 ) 变量 分 类 的 数据 进行 关于 类 型 概率 的 推断 ， 
在 9.4 节 和 9.5 节 中 , 我 们 考虑 对 根据 两 个 定性 变量 分 类 的 数据 进行 关于 类 型 概率 的 推断 . 推 斯 中 
使 用 的 大 部 分 统计 量 近似 地 服从 卡 方 分 布 族 , 虽然 这 种 近似 的 恰当 性 证 明 超出 了 本 书 的 范围 , 但 是 
和 定理 的 某 些 方面 可 以 从 前 面 已 经 学 过 的 章节 中 获得 . 


9.2 估计 单 向 表 中 的 类 型 概率 


考虑 一 个 多 项 试验 , 它 有 相应 于 单个 定性 变量 的 各 种 类 型 的 上 种 结果 . 这 种 试验 的 数据 ( 即 类 型 
计数 ) 类似 于 表 9.2 中 的 数据 ， 其 中 Nis ny," nk, 表示 类 型 计数 ， 并 且 n =n + nə. + + nk. 因为 仅 
用 一 个 定性 变量 就 构成 类 型 或 结果 , 所 以 通常 称 这样 的 表格 为 单 向 表 . 

为 了 估计 单 向 表 中 的 类 型 概率 , 考虑 将 多 项 试验 简化 为 二 项 试验 , 即 分 离 出 类 型 i, 并 将 其 余 类 











型 合并 . 由 于 知道 在 成 功 次 数 为 了 的 二 项 试验 中 , p = Y/n 329.2 类 型 计数 的 单 向 表 
是 二 项 参数 p 的 一 个 好 估计 量 , 从 而 X m 
bi 2m 1 2 3 Us k 


n 


是 多 项 试验 中 与 类 型 i 关联 的 概率 p 的 一 个 好 的 估计 量 ， — ” 


n, n4 Ut ny 
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Pi 与 具有 相同 的 性 质 , BUSH n 很 大 时 , p, 近 似 服从 正 态 分 布 (根据 中 心 极限 定理 ) 且 有 
E(p;) =P; 
和 
VC; 


因此 ,下面 的 框 格 中 给 出 了 pi 的 大 样本 置信 区 间 的 构造 . 


pi(1 —p;) 
) = 一 





Akh p, 的 大 样本 (1 —a)100% BH X ia) 


^ p. -Pp;) 
Pi Ezaz, | n 


我 们 将 用 (p; -P frr — 2399 iR oj) 8320035. p, fl p; 的 线性 函数 近似 服从 正 态 分 布 , H. 
E(pi - pj) =P; - Pj 


由 表 B.5 可 得 z. Md 





和 
V(p; - pj) -V(p;) + V(p;) -2Cov(Pi， b) 
因为 两 个 类 型 计数 , 即 n; 和 nj(izj) 的 协 方差 为 : 
Cov(n;,n;) = -npipj 
《证 明 留 作 本 节 末 的 练习 ) , 从 而 相应 估计 量 p, 和 ;之 间 的 协 方差 为 ; 
n 


Cov(Bib) =EL (Bi =p) By =p) 1 = E[ (7 -E (ZE - 92) = [mi n s - 7p] 


n 








1 1 1 7 PiPj 
=—E[ (n; —np.) (n; - np.)] = —C i n.) 2—( npp) 2 — 
n2 [ (nj np;) (nj np;)] n? ov(n; nj) ut np;p;) n 


所 以 





"E ñ ñ a a, Pi(l-pi) p;(1-p;) 2p;p; 
V(p; -p;) = Vp) + V(p;) -2Cov(p;,p;) = t mi 


(p; - pj) 的 大 样本 (1 - a) 10090 置信 区 间 由 下 面 的 框 格 给 出 





单 向 表 中 (p; —p,) 的 大 样本 (1 — a) 100% HEX B] 





aoa p,(1-p,) «p.(1- 2p.p. 
(b -&) NET Pi) *p(1-p;) *2p;p, 


n 








由 表 B.5 可 得 2,2 的 值 . 





参考 表 9. 1, 求 所 有 不 合格 叶轮 中 属于 生产 线 A 的 比率 pi BJ 95% EHI. 注意 pi 不 是 生 
产 线 A 生产 的 叶轮 是 不 合格 品 的 比率 , 而 是 由 生产 线 A 生产 的 不 合格 叶轮 占 所 有 不 合格 叶轮 的 比率 . 
解 从 表 9.1, 有 m =15 X n =103. 所 以 pi 的 95% 置信 区 间 是 ; 
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$93 





或 者 0. 146 «0. 068. 所 以 pi 的 区 间 估 计 是 0. 078 ~ 0. 214. 

也 就 是 说 , 我 们 以 95% 的 置信 相信 生产 线 A 生产 的 不 合格 叶轮 占 所 有 不 合格 叶轮 的 真实 比率 落 
在 区 间 0. 078 ~ 0. 214. 
参考 例 9. 1, 求 不 合格 叶轮 属于 生产 线 A 和 了 的 比率 之 差 (pi — px ff 95% 2 P: bc lal. 
解 从 表 9.1, fin =27 Kp =n, /n 221/103 20.262. 所 以 (Pi -ps) 的 95% 和 置信 区 间 是 ， 


^ ^ p - bi) +p (1 - pa) +2p Do 
(pi - P3) tzg 








n 





(0. 146) (0. 854) + (0. 262) (0. 738 +2(0. 146) (0. 262) _ 





= (0. 146 -0.262) +1. % Í 


-0. 116 +0. 121 


103 


所 以 不 合格 叶轮 属于 生产 线 A 和 B 的 比率 之 差 (p， -zz) 的 区 间 估 计 是 - 0.237 ~ 0. 005. 因为 这 个 区 
间 含 有 0, 所 以 没有 充分 的 证 据 (95% 置信 水 平 ) 表 明 两 个 比率 不 同 . 


应 用 练习 
9.1 颌 功能 障碍 研究 . 一 份 关 于 患 有 匡 下 颌 ( 颌 ) 关 


co 


节 功 能 障碍 (TMD ) 牙科 病人 的 报告 发 表 在 General 

Dentistry(2004 年 1/2 月 ). 为 了 进行 TMD 试验 研 

究 , 选取 60 个 病人 构成 随机 样本 . 在 研究 之 前 , 每 

位 病人 完成 与 TMD 有 关 的 两 种 非 功 能 性 颌 习惯 

(磨牙 症 ( 磨 齿 ) 和 咬牙 症 ) 的 调查 . 60 个 病人 中 , 3 

人 承认 有 磨牙 的 习惯 , 11 人 承认 有 咬牙 的 习惯 , 30 

人 承认 同时 有 这 两 种 习惯 ,而 另外 16 人 则 没有 这 

两 种 习惯 . 

a. 描述 研究 中 感 兴趣 的 定性 变量 , 给 出 与 变量 关 
联 的 水 平 ( 类 型 ). 

b. 构造 样本 数据 的 单 向 表 . 

c. 求 并 解释 承认 同时 有 两 种 习惯 的 牙科 病人 的 真 
实 比率 的 95% B P< [a]. 

d. 求 承 认同 时 有 两 种 习惯 的 牙科 病人 的 真实 比率 
和 没有 这 两 种 习惯 的 牙科 病人 的 真实 比率 之 差 
的 95% 置信 区 间 , 并 给 出 解释 . 


2 交叉 路 口 转 索 . 一 项 交通 研究 表明 在 下 午 4 点 


到 7 点 时 间 段 , 通过 繁忙 交叉 路 口 的 972 辆 机 动车 

中 , 有 357 辆 左 转 , 321 辆 右 转 , 294 辆 直行 . 

a. 构造 这 项 研究 的 单 向 表 . 

b. 求 在 此 时 间 段 内 直行 通过 交叉 路 口 车 辆 的 真实 
比率 的 95% 置信 区 间 . 

c. 求 在 此 时 间 段 内 分 别 左 转 和 右 转车 辆 的 比率 之 
28 BJ 95% 置信 区 间 . 解释 这 个 区 间 . 


-3 CAD # X. Mechanical Engineering 每 月 都 会 对 


读者 进行 “每 月 问题 ”的 在 线 调查 . 2004 年 7 月 公 
布 了 关于 “你 感觉 充分 了 解 计算 机 辅助 技术 (CAD) 
在 工作 中 的 作用 吗 " 的 调查 结果 . 结果 是 : 44% 回 


co 


ke] 


答 “ 是 ”, 1296 回答 “ 否 , 但 我 并 不 担心 ”, 35% 回答 

"f. 但 我 关心 ”, 9% 回答 “在 我 的 工作 中 并 不 需 

要 了 解 CAD. ”假定 共有 1 000 名 读者 进行 了 在 

线 调查 . 

a. 求 并 解释 对 CAD 在 他 们 工作 中 的 作用 充分 了 解 
的 读者 比率 的 95% 置信 区 间 . 

b. 求 并 解释 回答 “ 否 , 但 我 并 不 担心 . ”和 回答 
UB, 但 我 关心 . "的 读者 比率 之 差 的 95% 置信 
区 间 . 


“4 数字 信号 和 图 像 处 理 . 数字 信号 和 图 像 处 理 


(DSIP) 有 着 广泛 的 应 用 , 包括 娱乐 (视频 点 播 ) 、 
电子 医学 、 安 全 /监视 、 军 事 目标 识别 、 无 线 通 信 
和 智能 传输 系统 . 因此 ,对 于 精通 DSIP 工程 师 的 
需求 快速 增长 . International Journal of Electrical En- 
gineering Education( 2004 年 4 H ) 刊登 了 关于 在 西 
密歇根 大 学 (WMU ) 试验 的 DSIP 本 科研 究 课 程 评 
佑 的 调查 报告 . 50 名 学 生 对 “我 认为 这 项 研究 经 历 
对 我 将 来 的 职业 生涯 很 有 价值 ”的 观点 给 出 了 响 
应 , 结果 是 : 47 名 学 生 同 意 该 观点 , 3 名 学 生 保 持 
中 立 , 没有 学 生 反 对 该 观点 . 

a. 估计 WMU 的 学 生 中 同意 DSIP 研究 经 历 对 他 们 
职业 生涯 很 有 价值 的 学 生 的 比率 , 利用 99% 置 
信 区 间 . 

b. 估计 WMU 的 学 生 中 同意 该 观点 和 对 该 观点 保 
持 中 立 的 学 生 的 比率 之 差 , 利用 99% 置信 区 间 . 


.5 冰 融 化 池 的 特征 . 参考 例 2.1, 国家 冰雪 中 心 


(NSIDC) 收 集 的 加 拿 大 北极 地 区 504 个 冰 融 化 池 
的 数据 , 数据 保存 在 PONDICE 文件 中 . 研究 冰 融 
化 池 的 环境 工程 师 感 兴趣 的 变量 是 观察 每 个 冰 融 
化 池 中 冰 的 种 类 , 将 冰 的 种 类 分 为 当年 冰 、 多 年 冰 
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和 定 着 冰 . 下 表 给 出 了 这 504 个 冰 融 化 池 中 冰 的 种 
类 的 SAS 汇总 表 . 
a. 利用 90% 置信 区 间 估 计 加 拿 大 北极 地 区 有 当年 


冰 的 冰 融 化 池 的 比率 . 
b. 利用 90% 置信 区 间 估 计 加 拿 大 北极 地 区 有 当年 
冰 和 多 年 冰 的 冰 融 化 池 的 比率 之 差 . 





The FREQ Procedure 


Cumulative Cumulative 








个 缓慢 旋转 的 圆 盘 下 面 ， 圆 盘 用 来 阻挡 他 们 的 
视线 . 当 试 验 者 感觉 右边 向 上 时 叫 停 . 记录 圆 盘 
上 的 明亮 图 案 位 置 对 应 于 每 个 学 生 的 身体 方向 ， 
试验 者 只 选择 3 个 圆 盘 的 明亮 图 案 作 为 重 直 提 
示 : (1) 亮 侧 在 上 方 ,，(2) 上 暗 侧 在 上 方 , (3) 3€ 
侧 和 暗 侧 并 排 在 试验 者 的 头 部 任 一 侧 . 下 面 的 表 
格 给 出 了 试验 中 的 计数 频数 . 构造 选择 亮 侧 在 上 
方 作为 垂直 提示 的 试验 者 比率 与 选择 上 暗 侧 在 上 
方 作为 垂直 提示 的 试验 者 比率 之 差 的 95% 置信 
KE. 解释 结果 . 








圆 盘 的 方向 
亮 侧 向 上 暗 侧 向 上 亮 侧 和 暗 侧 并 排 
58 15 17 





-7 肠胃 炎 爆 发 . 由 于 污水 处 理 厂 长 期 存在 的 过 滤 


不 足 和 机 能 失常 , 在 科罗拉多 州 发 生 了 水 污染 非 细 

菌 性 肠胃 炎 . 进行 一 次 研究 以 确定 在 传播 期 肠胃 炎 

病 的 发 生 与 水 的 消费 量 是 否 有 关 ( American Water 

Works Journal, 1986 年 1 月 ). 对 传播 期 有 肠胃 炎症 

状 的 40 位 居民 样本 进行 家 庭 电 话 采 访 得 到 了 每 天 

以 8 末 司 玻璃 杯 计 的 水 消费 信息 . 

a. 用 99% 置 信 区 间 估 计 每 天 喝 1~2 杯 水 的 肠胃 炎 
患者 百分数 . 

b. 用 99% 惫 信 区 间 估 计 每 天 喝 1~2 杯 水 的 肠胃 炎 
患者 百分数 和 每 天 不 喝 水 的 肠胃 炎 患 者 百分数 
ZE. 





ICETYPE Frequency Percent Frequency Percent 

First-year 88 17.46 88 17.46 

Landfast 196 38.89 284 56.35 

Multi-year 220 43.65 504 100.00 

练习 9.5 的 SAS 输出 

. 6 定向 提示 试验 . 参考 练习 7. 59, Human Fac- 每 天 8 盘 司 玻璃 杯 的 水 消费 量 
tors (1988 年 12 月 ) 关于 亮度 作为 体位 提示 的 1-2 3-4 GARDE SH 
WR. 90 名 大 学 生 , 在 黑暗 中 仰 躺 着 ， 置 于 一 个 有 症状 的 
旋转 式 平台 以 温 淆 他 们 的 方向 感 ,平台 位 于 一 。 受 访 者 数 6 DO DB 10 4 


资料 来 源 : Hopkins, R. S. , 
study of a Colorado outbreak. ” American Water Works Journal, 
Vol. 78, No. 1, Jan. 1996, p. 42( € 1). Copyright (51986, 
American Water Works Association. 


et al. “Gastroenteritis; Case 


-8 灌流 庄稼 . 在 佛罗里达 州 , 由 于 无 规律 的 雨量 


模式 和 土壤 较 低 的 储 水 能 力 , 充足 灌溉 对 于 生产 更 
多 的 农作物 是 必要 的 . 一 个 研究 团队 为 了 灌溉 佛 罗 
里 达州 中 部 庄稼 , 提出 了 5 种 可 供 选 择 的 水 资源 管 
理 方案 . 随机 采访 了 100 名 农业 工程 师 , 询问 他 或 
她 认为 哪 种 方案 可 以 得 到 最 大 的 产量 , 答案 汇总 
如 下 . 





方案 A B C D E 





a. 构造 推荐 方案 C 的 农业 工程 师 真实 比率 的 90% 
置信 区 间 . 

b. 构造 推荐 方案 的 农业 工程 师 真实 比率 和 推荐 方 
R B 的 农业 工程 师 真实 比率 之 差 的 90% 置 信 区 间 . 

c. 构造 推荐 方案 A 的 农业 工程 师 真实 比率 和 推荐 
方案 D 的 农业 工程 师 真实 比率 之 差 的 90% 置信 
区 间 . 


理论 练习 


9.9 对 于 多 项 概率 分 布 , 证 明 : 


Cov(n,,n;) = pip; 
( 提示; 首先 证 明 E(n;n,) =n(n -1)p,p;- ) 
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9.3 ”检验 单 向 表 中 的 类 型 概率 


假定 利用 表 9. 1 的 数据 希望 检验 关于 不 合格 叶轮 类 型 概率 的 假设 . 特别 地 , 想 检 验 属于 五 条 生 
产 线 的 不 合格 品 比率 相等 的 ( 原 ) 假 设 , BB Ho: pi =p. =… =ps =0.2, 备 择 假 设 为 至 少 两 个 概率 是 不 
等 的 . 直观 地 , 选取 的 检验 统计 量 是 基于 观测 类 型 计数 nl , n,,…, ns, 与 它们 的 期 望 值 或 期 望 类 型 
计数 

E(nj) =np; = (103) (0. 2) =20. 6 (i21,2,:,5) 

的 离 差 . 观测 的 类 型 计数 和 期 望 类 型 计数 间 的 较 大 离 差 , 提供 了 表明 假设 的 类 型 概率 是 不 正确 的 
证 据 . 

检验 有 种 类 型 的 多 项 试验 的 类 型 概率 假设 , 所 用 的 统计 量 是 基于 观测 和 期 望 单 元 计数 离 差 的 
加 权 平 方 和 ， 即 

[nj 一 E(nj)]? 
x i > E(n,) 


i=l 


用 np; 代替 E(n;) 并 且 展 开 分 子 , 可 以 得 到 下 式 (证 明 略 ) : 
2 Ë (n, - np,)2 £ n° 
x > np; (X 二- 
当 试 验 次 数 n 充分 大 , 使 得 E(nj)) >5, i=1,2,…, kE, 统计 量 x? 近似 地 服从 卡 方 抽样 分 布 (证 
Bjm&) O. 如 果 离 差 [n; - E(n,) ] 较 大 , 那么 x 的 值 
将 大 于 期 望 的 . 所 以 , 检验 的 拒绝 域 是 Y* >x, 这 里 
y. 是 x 位 于 卡 方 分 布 上 尾 面积 为 a 处 ( 见 图 9.1) 
BJ (&. 
对 类 型 计数 设置 的 每 个 线性 独立 的 限制 , 近似 
卡 方 分 布 的 自由 度 总 是 等 于 大 减少 1 个 自由 度 . 例 
wm, 对 类 型 计数 总 是 至 少 有 一 个 线性 限制 , 因为 它 


们 的 和 必须 等 于 样本 大 小 n: | 一 拒绝 域 一 ~ 
n) 二 7 + tn =n 图 9.1 卡 方 检验 的 拒绝 域 


foc) 








多 项 概率 的 假设 检验 : 单 向 表 
Ho :pi =Pi,o»P2 = P2,103" ,Ds =Po Xp Pi,osP2,0s 1 Pr, 0 代表 多 项 概率 的 假设 值 . 
H: 至 少 有 一 个 多 项 概率 不 等 于 假设 值 . 





检验 统计 量 :多 = > a rA (X = k^ 


X E(n) =npio 是 在 可 成 立 的 条 件 下 , 得 到 类 型 i 的 期 望 个 数 ， 总 的 样本 大 小 为 
拒绝 域 :x* >x, kE XA #(k-1)4 Ë dE. 
假定 : 为 了 卡 方 近似 的 有 效 性 , 对 所 有 nn 有 E(n,) 25. 














O 对 于 某 些 应 用 , 期 望 单元 计数 可 以 小 于 5. 这 方面 更 多 内 容 可 以 参考 本 章 参考 文献 中 列 出 的 Cochran (1952) 的 文章 . 
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如 果 必 须 估 计 类 型 概率 , 那么 还 要 增加 其 他 的 限制 . 因为 每 一 个 估计 都 涉及 类 型 计数 的 一 个 线 
性 函数 ,所 以 对 每 个 需要 估计 的 类 型 参数 ， 卡 方 自由 度 都 必须 减 去 1 个 自由 度 . 

对 类 型 概率 取 指定 值 的 假设 检验 对 于 类 型 计数 仅 有 一 个 线性 限制 , 即 nj + ns +… +n, =n. 因为 
在 Ho 中 指定 了 类 型 概率 的 值 , 所 以 不 需要 估计 它们 的 值 . 前 面 描述 了 检验 步骤 , 我 们 将 在 例 9.3 W 
述 卡 方 检验 的 简单 应 用 
参考 表 9. 1 提供 的 数据 . 检验 属于 5 条 生产 线 的 所 有 不 合格 叶轮 比率 相等 的 假设 , 利用 
a =0.05 检 验 . 

解 要 检验 Ho: pl =p =… =ps =0.2 对 备 。 表 9.3 表 9.1 数 据 的 观测 和 期 望 类 型 计数 
择 假 设 HL. 至 少 两 个 类 型 概率 不 等 . 已 经 计算 出 一 一 一 一 一 一 一 一 一 
E(n;) =np;=(103)(0.2) =20.6 (i21,2,--.,5) 

表 9.3 给 出 了 观测 和 期 望 ( 圆 括号 中 ) 的 类 型 
计数 . 将 观测 和 期 望 类 型 计数 值 代入 y? 公式 中 ， 
我 们 得 到 


观测 15 27 31 19 11 
期 望 (20.6) (20.6) (20.6) (20.6) (20.6) 
————u ct T 


-13. 36 





* (n. — n ; 2 -20.6)? -20.6)? _ 2 
y = > = s L. 05 3.6 Dr LG 元 4 人 me 
KURIER BUE Y? > Qos, HHK oA k-125 -1=4 个 自由 度 , 这 个 值 由 表 B8 ER yo = 
9.48773. 因为 X 观测 值 超 过 了 这 个 值 , 所 以 有 充分 的 证 据 (a = 0. 05) dE 4 Ho. 可 以 明显 看 出 , 至 少 
有 一 条 生产 线 比 其 他 生产 线 对 较 高 的 不 合格 叶轮 比率 负 有 责任 . (k. 可 以 使 用 统计 软件 进行 单项 表 
检验 , 图 9.2 给 出 了 SPSS 分 析 的 输出 . 因为 p 值 0.010( 着 重 显示 ) 小 于 a=0.05, 所 以 拒绝 Hy.) 


LINE 


Test Statistics 


C [ UNE | 
Chi-Squarea 13.359 
qf 4 
Asyrnp. Sig. 0.010 
a. Ü cells (.096) have expected frequencies less than 
5. The minimum expected cell frequency is 20.6. 






图 9.2 € 9.3 数据 的 SPSS 分 析 





— 
应 用 练习 完全 同意 RAHE 。 部 分 反对 ”完全 反对 
9.10 浏览 网 络 信息 .Ine Technology(1997 年 3 月 18 59 108 82 79 


日 ) 刊 登 了 Equifax/Harris 消费 者 私人 调查 结果 , 在 
这 份 调查 中 , 328 名 因特网 使 用 者 需要 表明 他 们 对 9. 11 冰 融 化 池 的 特征 . 参考 练习 9.5， 加 拿 大 北极 


“政府 需要 浏览 网 络 信 息 并 与 使 用 者 交流 , 以 阻止 地 区 冰 融 化 池 的 研究 . 在 下 页 给 出 了 504 个 冰 融 

欺骗 和 其 他 犯罪 ”观点 的 同意 水 平 . 每 一 个 回答 类 化 池 中 冰 种 类 的 SAS 汇总 表 . 假定 环境 工程 师 认 

型 中 使 用 者 的 个 数 汇 总 在 下 表 . 为 在 加 拿 大 北极 地 区 的 冰 融 化 池 中 , 有 15% 是 

a. 为 了 确定 因特网 使 用 者 的 意见 是 否 均匀 分 配 于 当年 冰 , 40% 是 定 着 冰 , 45% 是 多 年 冰 . 利用 
4 个 类 型 中 , 给 出 原 假设 和 备 择 假 设 . o =0.01 检验 工程 师 的 理论 . 

b. 做 a 中 检验 , 利用 a =0.05. 9.12 管理 系统 失效 , 参考 练习 2.4, Process Safety 

c. 指出 上 述 问 题 中 的 1 型 错误 和 荆 型 错误 . Progress (2004 年 12 月 ) 和 美国 化 学 安全 与 危险 调 


d 为 了 保证 b 中 检验 的 有 效 性 , 需要 什么 假定 ? 查 局 关于 由 管理 系统 失效 造成 工业 事故 的 研究 . 下 
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表 给 出 了 83 个 事故 样本 发 生 的 根本 原因 的 分 解 . 
在 4 类 原因 中 事故 的 百分率 存在 显著 差异 吗 ? 利 
用 a =0. 05 检验 . 





管理 系统 原因 类 型 事故 数 
工程 和 设计 27 
过 程 和 实践 24 
管理 和 监测 22 
训练 和 交流 10 


合计 83 
一 一 -一 C 
资料 来 源 : Blair, A. S. “ Management system failures identi- 
fied in incidents investigated by the U. S. Chemical Safety and 


Hazard Investigation Board. " Process Safety Progress, Vol. 23, 
No. 4, Dec. 2004 ( E 1). 


co 


-13 物种 类 热 区 . 参考 练习 3.75, Nature( 1993 年 9 
月 ) 关 于 英国 动 植物 种 类 “ 热 区 ”的 研究 . 热 区 定义 
为 10 km 的 物种 丰富 区 域 , 即 这 一 区 域 是 感 兴趣 
物种 的 集中 栖 居 地 . 类 似 地 , 冷 区 是 一 个 10 kmz 的 
物种 稀少 区 域 . 下 面 的 表 分 别 给 出 了 在 2588 个 
10 km? 区 域 样本 中 蝴蝶 热 区 和 蝴蝶 冷 区 的 个 数 . 理 
YE E, 5% 的 区 域 应 该 是 贿 蝶 热 区 , 5% 应 该 是 蝴蝶 
冷 区 , 剩 下 (90% ) 的 是 中 间 区 域 . 利用 w =0.01 检 
验 此 理论 . 


蝴蝶 热 区 123 
蝴蝶 冷 区 147 
中 间 区 域 2318 
合计 2 588 


资料 来 源 ; Prendergast, J. R. 
incidence of diversity hotspots and conservation strategies. " 
Nature, Vol. 365, No. 6444, Sept. 23, 1993, p. 335( %1 ). 


9.14 交叉 路 口 转弯 , 参考 练习 9. 2 的 交通 研究 . 
a. 数据 与 交通 量 被 三 个 方向 平均 分 配 的 假设 不 一 
313? 利用 a 20.05 检验 . 
b. 数据 能 提供 充分 的 证 据 证 明 进 入 交叉 路 口 的 机 
动车 超过 1⁄3 向 左 转 吗 ? 利用 o = 0. 05 检验 . 
9.15 肠胃 炎 爆 发 . 参考 练习 9.7, American Water- 
works Journal (1986 年 1 月 ) 关 于 肠胃 炎 情 况 的 研 
究 . 构造 一 个 检验 以 确定 在 传播 期 肠 胃炎 疾病 的 发 
生 与 水 的 消费 量 是 有 关 的 . 利用 a =0. 01. 
16 定向 提示 试验 . 参考 练习 9.6, Human. Factors 
(1988 4E 12 月 ) 关 于 定向 提示 的 研究 . 构造 一 个 检验 
以 比较 落 人 三 种 圆 盘 定向 类 型 试验 者 的 比率 ， 假定 你 
想 要 确定 这 三 个 比率 是 否 不 同 , 利用 a =0.05. 
9.17 HEX RR. 参考 练习 9. 8 农业 工程 师 的 调查 . 
数据 提供 了 充分 的 证 据 表明 对 5 种 水 资源 管理 方案 
中 的 一 种 或 几 种 的 偏好 吗 ? 利用 a =0. 05 检验 . 


, et al. “Rare species, the co- 


© 





The FREQ Procedure 


Cumulative Cumulative 











ICETYPE Frequency Percent Frequency Percent 
First-vear 88 17.46 88 17.45 
Landfast 196 38.89 284 56.35 
Multi-year 220 43.65 504 100.00 
2&2] 9.11 的 SAS 输出 
理论 练习 Y) , WE THX n, 
2A .Y-np 
9.18 94 n RIKET, y^ 近似 服从 卡 方 抽样 分 布 . 事 Z=— 
npq 


实 的 一 般 证 明 超出 了 本 书 的 范围 , 但 是 , 对 于 二 项 
(k=2) 情 形 可 以 证 明 它 是 成 立 的 . 在 选 做 练习 
6.118 中 , 我 们 论述 了 如 果 Z 是 标准 正 态 随 机 变 
R, 那么 Z 是 1 个 自由 度 的 卡 方 随机 变量 . 将 二 项 
试验 中 两 个 单元 的 计数 表示 为 a = Y #l n, = (n - 


近似 服从 标准 正 态 分 布 , HE Z 是 近似 服从 自由 
度 为 1 的 卡 方 随机 变量 . 当 大 =2 时 , 用 计算 证 明 
x = Z°. 


9.4 关于 双向 表 ( 列 联 表 ) 中 类 型 概率 的 推断 
22 ERIS, 3 节 介绍 的 方法 对 数据 一 个 方向 (或 单 向 ) 的 分 类 是 合适 的 ， 例 如, 例 9.3 中 不 合格 
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叶轮 的 类 型 数据 相应 于 定性 变量 生产 线 的 “ 值 ”. 通常 , 我 们 希望 将 数据 按照 类 型 的 两 个 方向 ， 即 根 
据 两 个 定性 变量 分 类 . 这 种 分 类 目的 常常 是 确定 类 型 的 两 个 方向 是 否 相关 . 


为 了 阐述 这 个 问题 ,考虑 一 份 寄 往 150 个 家 庭 样 表 9.4 三 哩 岛 调查 的 列 联 表 
本 的 问卷 调查 , 这 份 调查 是 在 1979 年 宾夕法尼亚 哈 SSW MEA (mile) I 
利 斯 堡 附近 的 三 哩 岛 核反应 堆 事件 发 生 2 周 内 寄 出 1-6 7-2 13+ 合计 





的 . 其 中 一 个 问题 是 居民 对 于 全 部 疏散 的 态度 :“ 附 全 部 同意 18 15 33 66 

近 地 区 应 该 全 部 朴 散 吗 ?" 将 居民 根据 居住 社区 与 三 s 反对 20 19 45 — ^84 

哩 岛 的 距离 (mile) 以 及 他 们 对 于 全 部 朴 散 的 意见 分 。 合计 38 34 78 150 
类 , 表 9. 4 的 双向 表 给 出 了 随机 选取 的 150 个 家 庭 回 ”资料 来 源 ; Brown, S. , et al. Final report on a survey of 
答 情 况 的 汇总 . 这 个 表 称 作 列 联 表 ; U 表示 按 类 型 的 “ Three Mile Island area residents. ” Department of Geogra- 
两 个 尺度 或 维 数 ， 即 与 三 哩 岛 BU RE BUND AE Pk Ek: phy, Michigan State University, Aug. 1979. 
问题 的 响应 , 将 多 项 计数 数据 分 类 . 

表 9.4 中 位 于 某 特定 行 和 列 中 的 每 一 个 单元 代表 n= 150 个 观测 值 两 个 方向 分 类 形成 的 = 
(2)(3) 26 种 类 型 之 一 . 表 9. Sa 给 出 了 表 9.4 试验 的 单元 计数 的 符号 ; 表 9. 5b 给 出 了 相应 的 单元 ， 
行 和 列 的 概率 . 于 是 mi 代表 居住 在 事 发 地 6 英里 以 内 且 支 持 全 部 朴 散 的 人 数 , p11 代表 对 应 的 单元 概 
率 . RO. 5a 给 出 了 行 和 (表示 为 nj. Sl n;. ) 与 列 和 (表示 为 n.1,n., 和 n.3). 表 9.5b 给 出 了 相应 的 
行 概率 和 以 及 列 概率 和 . 行 及 列 概率 和 称 为 边缘 概率 . 例如 ,边缘 概率 pi, ERAREMA, 
而 边缘 概率 p .1 是 居住 在 离 三 哩 岛 1 = 6 mile 之 内 的 受 访 者 的 概率 . TE, 

Pi. =Du +plz tpg = PCIE BBLERC) 











和 
P .1=Pll tpa = 了 (居住 在 离 三 哩 岛 1 ~6 mile) 
表 9. 5a 列 联 表 观 测 计数 表 9. 5b 列 联 表 概 率 

与 三 哩 岛 的 距离 ( mile) 合 计 与 三 哩 岛 的 距离 (mile) ^od 

1-6 7~12 134 1-6 7-12 13+ 
全 部 FE nn mz ni ni. 全 部 HŠ Pu P Pis pi. 
Bu Bow na ny ns m. Bii ” 反对 Pa Pn Pa pi. 
合计 n. n. n. n 合计 p. Pa Pa 1 


可 以 看 出 我 们 描述 的 是 一 个 试验 次 数 为 150, 有 (2) (3) =6 个 类 型 的 多 项 试验 . 因为 150 个 居民 
是 随机 抽取 的 , 所 以 每 次 试验 可 以 认为 是 独立 的 ， 并 且 概 率 对 于 每 次 试验 可 以 看 成 保持 不 变 的 . 

研究 的 目的 是 判断 两 个 分 类 ， 与 三 哩 岛 的 距离 和 对 于 全 部 疏散 的 态度 是 否 相关 . 即 如 果 知 道 与 
三 哩 岛 的 距离 ,这 个 信息 能 提供 居民 对 于 朴 散 态度 的 线索 吗 ? 从 概率 意义 来 说 , (第 3 章 ) 事 件 4 和 
B 独立 意 昧 着 P(ANB) =P(A)P(B). 类 似 地 , 在 列 联 表 分 析 中 ， 如 果 两 个 类 型 是 独立 的 , 那么 一 个 
事物 被 分 类 为 表格 中 任 一 特定 单元 的 概率 是 相应 的 边缘 概率 的 乘积 . 于 是 在 独立 性 假定 下 , 由 表 
9. Sb, 我 们 有 

Piu ZPi.P a P12 =P1. P .2 P13 7 Di. P .3 

等 等 . 所 以 ， 分 类 方向 是 独立 的 原 假设 等 价 于 每 一 个 单元 的 概率 等 于 它 的 行 边缘 概率 和 列 边缘 概率 
乘积 的 假设 . 如 果 数 据 与 由 这 些 概 率 计算 的 期 望 单元 计数 不 一 致 ， 那么 有 证 据 表 明 分 类 的 两 个 方向 
是 相关 的 . 
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如 果 我 们 计算 本 例 中 的 期 望 单元 计数 , 很 快 会 发 觉 这 是 困难 的 . 边缘 概率 未 知 , 因此 需要 估计 . 
第 i 行 边缘 概率 pi. 的 最 好 估计 是 : 








ao Pi _ 5 i (TRI 

pc. n 
类 似 地 , 第 7 个 边缘 列 概率 的 最 好 估计 是 : 

a hg 第 7 列 和 

了 n 


所 以 , 列 联 表 中 第 i 行 j 列 单元 的 估计 的 期 望 单元 计数 是 : 
E(n;) = nb,. P =a (e (24) ena GS R) On 218 
ij Pj n 


RI. 6 是 rxc 列 联 表 ( 包 含 r 行 c 列 ) 的 一 般 形式 . 当 n 充分 大 时 , 检验 统计 量 











na) < g esu) 
= izi E(n;) = ic (=) 
近似 服从 卡 方 分 布 , 检验 的 拒绝 域 是 x? 2X2 (LER 9.3). 
fo) 
39.6 一 般 的 rx c 列 联 表 
列 











行 和 
1 2 c 

1 ny ny n n; 

2 na ny mn, n L 2 
" . . . . . 9 x: x 
TT : : : : : 

一 拒绝 域 一 ~ 
r n n e n Ry, 
列 和 na na c9 n4 n 图 9.3 相关 性 卡 方 检验 的 拒绝 域 


下 面 确定 近似 卡 方 分 布 的 自由 度 , TERR km re. 我 们 必须 从 减 去 1 个 自由 度 , 因为 所 有 re 个 单元 
计数 的 和 必须 等 于 n. 我 们 还 要 再 减 去 (r- 1) , 因为 需要 估计 (r -1) 个 行 边缘 概率 . (最 后 -一 个 行 概率 是 
确定 的 , 因为 所 有 行 概率 之 和 必须 等 于 1. ) 类似 地 , 还 要 再 减 去 (c - 1) , 因为 需要 估计 (ec - 1) 个 列 边 
缘 概率 . 所 以 卡 方 的 自由 度 是 : 

df = 类-《〈 对 单元 计数 线性 独立 限制 的 个 数 ) mre - (1) -(r-1) -(c-1) 
=rc-r-c+l=(r-l)(c-1) 
卡 方 检验 汇总 在 下 面 ; 例 9.4 给 出 其 应 用 . 


列 联 表 分 析 的 一 般 形式 : 独立 性 检验 





H,: 两 个 类 型 是 独立 的 
H,; 两 个 类 型 是 相关 的 





c r o È . 2 
检验 统计 量 := Y Y _ 
j=l n; 
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其 中 
^ n.n, n, = 第 i 行 和 
Eln) = n n j=% j Fifa 
EAR: K Xo REX, (r-1)(c-)D B H E. 
假定 ; 1. nn 个 观测 计数 是 感 兴趣 总 体 的 一 个 随机 样本 ,可 以 认为 它 是 有 rxe 种 可 能 结果 的 多 项 试验 . 
2. X TRE Y^ 近似 的 有 效 性 ,要求 对 所 有 单元 估计 的 期 望 计数 大 于 或 等 于 5. 











用 表 9.4 中 的 数据 判断 哈 利 斯 堡 居民 对 于 三 哩 岛 全 部 政 散 的 态度 是 否 依赖 于 居民 居住 在 
与 核反应 堆 多 远 的 距离 (mile). 
解 ” 列 联 表 分 析 的 第 一 步 是 计算 估计 的 期 望 单元 计数 . 例如 ， 
ni.n.1 _ (66) (38) 





E(n ) == = is =16.72 
E(ng) == 2 = (66) (34) - 14. 96 





n 150 





na. n.s (84)(78 
E(nj) = = 3 ( x ) -43.68 


单元 计数 (单元 中 上 面 的 数 ) 和 相应 的 估计 期 望 值 (单元 中 下 面 的 数 ) 由 图 9.4 列 联 表 分 析 的 SAS 输 
出 给 出 . l 








Table of EVAC by DISTANCE 





EVAC DISTANCE 

Frequency 

Expected Total 
84 
B6 

Total 38 34 78 150 


Statistics for Table of EVAC by DISTANCE 


Statistic DF Ualue Prob 
Chi -Square 2 0.2558 0.89755 
Likelihood Ratio Chi-Square 2 0.2653 0.8758 
Mantel-Haenszel Ehi-Square 1 0.2587 0.5110 
Phi Coefficient 0.0421 
Contingency Coefficient 5.0421 
Cramer's V 0.0421 





| Sample Size = 1590 





图 9.4 159.4 的 SAS 列 联 表 分 析 


在 这 个 研究 中 , 检验 统计 量 x? 计算 如 下 : 
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2 [nu - E(n)]? 4 [np] - E(n) ]? EE [23] - E(n3)]? 
X = 








Ë(nu) E(ni) E( n) 
y y [nj - E(nj)]? 


j E(nj) 
将 图 9.4 中 的 数据 代 和 人 表达 式 中 , 得 到 
2.(18-16.72)? (15 - 14.96)? +. A5 743.68)? 
16. 72 14. 96 43. 68 

CERGXA- fü y^ = 0. 2658 是 图 9. 4 SAS 输出 的 阴影 部 分 . 检验 的 拒绝 域 是 x > ü os = 5. 99147, 这 
里 .os 是 基于 (r -1)(c -1) =(1)(2) =2 个 自由 度 . 因为 计算 的 x 值 0. 266 小 于 这 个 临界 值 , 所 以 
不 能 拒绝 Ho; 没有 充分 的 证 据 表明 数据 类 型 的 两 个 方向 是 相关 的 . 看 上 去 ， 对 全 部 疏散 的 态度 与 距 
三 哩 岛 的 距离 是 无 关 的 . 

观察 图 9. 4 阴影 部 分 检验 的 p 值 超过 a =0.05, 我 们 可 以 得 到 同样 的 结论 . 

假设 得 到 的 结论 是 列 联 表 类 型 的 两 个 方向 是 相关 的 . 从 实际 来 说 ， 这 意味 着 落 入 某 个 定性 变量 
类 型 的 观测 值 的 百分数 分 布依 赖 于 另 一 个 变量 的 水 平 . 在 例 9.4 的 2 x3 rp, OASIS) E e HEU f 
的 居民 比率 p; 对 三 个 距离 组 是 不 同 的 . 为 了 判断 差异 的 大 小 , 需要 运用 7 10 节 的 方法 构造 差 (p .| - 
Pa). (pa -pa)flip.s -p .3) 的 置信 区 间 . 
ERR T" 0. 05 
9.19 马蹄 形 山 系 形成 的 研究 . 地 质 学 家 在 Tee- F, e =0.05. 

MM 年 10 月 ) 中 发 表 了 POE AY d. 用 本 问题 的 语言 给 出 合理 的 结论 . 


" ~ Z a 9. 20 高 纤维 饮食 研究 . Journal of the National Cancer 
基站 号 蹄 形 山系 (弯曲 的 山 带 ) 形成 的 研究 报 Institute(1991 年 4 月 ) 的 一 篇 研究 表明 SHE 
. XW 4° DX B 8E 8E Dc ( 移动 很 长 水 平 距离 的 





=0. 266 





岩 席 ) 进 行 了 比较 , SX Wi HEBE IK A rS A 
法 尼 亚 地 区 和 马里 兰 地 区 . 在 两 个 地 区 的 山脉 边 
缘 采 集 了 岩石 样本 ,并 对 每 块 岩石 测量 大 的 矿 
物 颗粒 包含 的 叶 理 面 交 轴 (FIA) , 下 表 给 出 了 两 
个 地 区 在 不 同 FIA 测量 类 型 下 岩石 样本 的 数量 . 
地 质 学 家 需要 利用 卡 方 独立 性 检验 判断 宾 夕 法 
尼 亚 地 区 推 覆 体 和 马里 兰 地 区 推荐 体 的 FIA 分 
布 趋势 是 否 相同 . 


宾夕法尼亚 马里 兰 





推荐 体 ERA 
0 - 79? 20 6 
FIA 80 ~ 149° 17 10 
150 ~ 179° 10 7 


资料 来 源 : Yeh, W. , and Bell, T. “Significance of dextral 
reactivation of an E-W transfer fault in the formation of the 
Pennsylvania orocline, central Appalachians ”, Tectonics, 


Vol. 23, No. 5, October,2004 ( £ 2). 


a 给 出 检验 的 原 假设 和 备 择 假设 . 
b. 研究 人 员 给 出 检验 统计 量 Y^ = 1.874, 你 同 


维 食物 可 以 防止 乳腺 癌 . 研究 人 员 将 随机 抽取 的 
120 只 试验 老鼠 分 为 4 组 , 每 组 30 只 , 所 有 老鼠 都 
注射 引起 乳腺 癌 的 药物 , 然后 以 脂肪 和 纤维 的 食 
物 喂 养 它们 15 周 , 但 是 ， 每 组 脂肪 和 纤维 的 含量 
不 同 . 在 喂养 期 结束 后 , 确定 每 组 串 有 癌症 肿瘤 的 
老鼠 个 数 , 下面 的 列 联 表 给 出 了 数据 汇总 情况 . 
饮食 
高 脂肪 高 脂肪 ” 低 脂肪 低 脂 肪 合计 
无 纤维 有 纤维 无 纤维 有 纤维 
癌症 有 27 20 19 14 80 
肿瘤 无 3 10 11 16 40 


合计 30 30 30 30 120 

. 抽样 满足 多 项 试验 的 假定 吗 ? 解释 . 

.计算 列 联 表 的 期 望 单元 计数 . 

. 计算 x 统计 量 . 

.有 证 据 表明 饮食 和 有 无 癌症 之 间 独 立 吗 ? 利用 
a =0.05 检验 . 

.利用 95% 置信 区 间 比 较 食用 高 脂肪 无 纤维 饮食 
的 患 癌 症 老鼠 比率 和 食用 高 脂肪 有 纤维 饮食 的 








£0 Tp 


e 
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患 癌症 老鼠 比率 , 解释 结果 . 


.21 RAR. Journal of Agricultural, Biological, 


and Environmental Statistics( 2000 年 12 月 ) 描 述 了 一 
项 试验 , EEK, 谷物 箱 贮 存 了 各 种 害虫 (如 谷 
R). 在 初夏 (8 月 ), 3 种 碗 状 的 捕捉 器 放置 在 谷物 
表面 用 来 捕捉 谷 蛾 ， 所 有 三 种 捕 扣 器 均 涂 抹 人 性 激 
R: 其 中 一 个 使 用 无 标记 的 黏合 剂 , 一 个 标记 发 光 
的 红粉 , 最 后 一 个 标记 发 光 的 蓝 粉 . 捕捉 器 星期 三 
放 好 , 并 在 随后 的 星期 四 和 星期 五 收集 战利品 . 下 
表 给 出 了 每 天 每 个 捕捉 器 捕获 的 火 蛾 个 数 . 构造 检 
验 (a =0. 10) 判断 三 种 捕捉 器 捕获 的 火 峨 数 百 分 比 
是 否 依赖 于 具体 的 日 子 . 








Sl mI _ _ 
Zr AN i Vh i 
无 标记 fuit — 蓝 色 标记 
星期 四 136 41 17 
星期 五 101 50 18 


资料 来 源 : Wileyte, E. P. 


models for estimating closed insect populations. ” Journal of 


, et al. “Self-marking recapture 


Agricultural , Biological, and Environmental Statistics, Vol. 5, 
No. 4, December 2000( 3€ 5A). 


-22 作战 模拟 试验 . 为 了 评估 战斗 机 飞行 员 对 形势 


的 注意 力 , 参加 了 作战 模拟 . 在 试验 的 一 个 随机 选 
定点 , 冻结 模拟 器 并 立刻 收集 形势 注意 力 的 数据 . 
然后 模拟 器 继续 运行 , 直至 测量 出 表现 情况 ( 如 杀 
伤 数 ). Human Factors(1995 年 3 月 ) 研 究 调查 了 模 
拟 器 的 暂时 停止 会 不 会 导致 飞行 员 表现 的 任何 变 
化 . 设计 试验 使 得 某 些 模拟 器 停止 以 收集 形势 注意 
力 数据 ,而 其 他 一 些 模拟 器 则 不 会 停止 ， 试验 根据 
飞行 员 的 杀伤 数 进行 分 类 ,180 次 试验 的 数据 汇总 
为 下 面 的 列 联 表 . 构造 列 联 表 分 析 并 解释 结果 . 


| 
杀伤 数 








A: 
0 1 2 3 4 ei 
停止 32 33 19 5 2 91 
不 停止 24 36 18 8 3 89 
fd 56 6 3 13 5 180 


.23 M FJ3EK 75 Re. 参考 练习 2. 10, Environmental 


Science & Technology(2005 年 1 月 ) 关 于 新 罕 布 什 尔 
州 公用 井 和 私 用 井 甲 基 权 丁 基 醚 (MTBE) 污染 情况 
的 研究 . 回忆 223 口 井 的 样本 数据 , 这 些 数 据 按照 井 
的 类 型 (公用 或 私 用 ) 、 含 水 层 ( 基 上 崇 或 松散 ) 和 MT 
BE 的 可 检测 水 平 ( 低 于 限度 或 检 出 ) 保 存在 MTBE 
文件 中 .( 下 表 列 出 了 前 10 口 井 的 数据 . ) 


oO 
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井 的 类 型 含水 层 检测 MTBE 的 状态 

TRI 基层 低 于 限度 
私 用 基层 低 于 限度 
公用 松散 E 

公用 松散 低 于 限度 
公用 松散 低 于 限度 
公用 松散 低 于 限度 
公用 松散 检 出 

公用 松散 低 于 限度 
公用 松散 低 于 限度 
公用 ` EA FH 

会 用 di 检 出 

资料 来 源 : Ayotte, J. D. ; Argue, D. M. , and McGarry, F. 


J. " Methyltert-butyl ether occurrence and related factors in 
public and private wells in southeast New Hampshire. " Envi- 
ronmental Science & Technology, Vol. 39, No. 1, Jan. 2005. 


a 利用 MTBE 文件 中 的 数据 建立 井 的 类 型 和 MTBE 
检 出 水 平 的 列 联 表 . 

b. 构造 检验 判断 MTBE 检 出 水 平 是 否 依赖 于 井 的 
类 型 . 利用 a = 0. 05 进行 检验 . 

c. 利用 MTBE 文件 中 的 数据 建立 含水 层 和 MTBE 
检 出 水 平 的 列 联 表 . 

d. 构造 检验 判断 MTBE 检 出 水 平 是 否 依赖 于 含水 
E. 利用 a =0. 05 检验 . 


.24 执 的 飞行 反映 . 阿拉 斯 加 三 角 湾 地 区 附近 的 沿 


海 石油 开采 导致 该 地 区 空中 交通 量 的 增加 -多 
数 是 大 型 直 升 飞机 . 美国 渔业 和 野生 动物 服务 中 心 
委派 研究 人 员 调 查 直 升 飞机 对 于 秋天 迁徙 前 栖息 
于 三 角 湾 地 区 成 群 太平 洋 野 鹅 的 影响 . (Statistical 
Case Studies :A Collaboration between Academe and In- 
dustry, 1998. ) 两 架 大 型 直 升 飞机 在 三 角 湾 地 区 上 
空 距离 殷 群 的 不 同 海拔 和 横向 距离 反复 盘旋 , 牧 
对 464 次 直 升 飞机 的 飞行 反映 (记录 为 “ 低 ” 或 
“E)E (H DK) 和 横向 距离 ( 百 米 ) 记录 在 
PACGEESE 文件 中 . (下 表 列 出 了 前 10 次 飞行 数 
据 . ) 





飞行 海拔 横向 距离 飞行 反映 
1 0.91 4.99 高 
2 0.91 8.21 高 
3 0.91 3.38 高 
4 9. 14 21.08 低 
5 1.52 6.60 高 





A o x 


R s 





co 
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(5) 
飞行 海拔 横向 距离 飞行 反映 

6 0.91 3.38 高 
7 3. 05 0. 16 高 
8 6.10 3.38 高 
9 3. 05 6. 60 高 
10 12. 19 6. 60 高 


资料 来 源 : Erickson, W. , Nick, T. , and Ward, D. “ Inves- 
tigating flight response of Pacific brant to helicopters at Izem- 
bek Lagoon, Alaska by using logistic regression. " Statistical 
Case Studies: A Collaboration. between Academe and Industry, 
ASA-SIAM Series on Statistics and Applied Probability, 1998. 


a. WRA POSEE T P4338: 少 于 300 m, 300 ~ 
600 m 和 600 m 以 上 , 对 海拔 和 飞行 反映 建立 一 个 
列 联 表 汇总 PACGEESE 文件 中 的 数据 . 

b， 构 造 检验 以 判断 鹅 的 飞行 反映 是 否 依赖 于 直 升 
飞机 的 海拔 , 利用 a =0. 01 检验 . 

c. 研究 人 员 对 横向 距离 进行 如 下 分 类 ; 少 于 
1000 m. 1000 ~ 2000 m. 2000 ~ 3000 m 和 3000 m 
BAE, 对 横向 距离 和 飞行 反映 建立 一 个 列 联 表 
汇总 PACGEESE 文件 中 的 数据 . 

d. 构造 检验 以 判断 鹅 的 飞行 反映 是 否 依赖 于 直 升 
飞机 的 横向 距离 ,利用 oa = 0. 01 检验 . 

e， 当 前 美国 联邦 航空 局 (FAA ) 对 飞行 三 角 湾 地 区 
规定 的 最 低 海 拔 标准 是 2000 ft( 大 约 610 m). 基 
于 a~d 的 结果 , 为 了 对 太平 洋 野 鹅 的 影响 最 
小 , 你 对 FAA 规则 有 什么 建议 ? 


-25 亚 北 极 植 物 研究 . 原 产 自 亚 北极 地 区 芬兰 的 种 


子 植物 特征 的 研究 刊登 在 Arctic , Antarctic, and Al- 

pine Research ( 2004 ^E 5 H). BUE IB HEPA CER E 

木 、 草 本 或 草 ) ,种 子 的 丰富 性 (无 种 子 、 稀 少 种 子 

或 丰富 种 子 ) , 繁殖 情况 ( 非 营 养 繁殖 、 有 可 能 营养 

繁殖 、 无 效 营 养 繁 殖 或 有 效 营 养 繁 殖 ), 种 子 的 重 

量 (0 ~0.1, 0.1 ~0.5, 0.5~ 1.0, 1.0 ~ 5.0 和 

25.0 mg) 以 及 散布 繁殖 体形 态 学 (没有 结构 、 冠 

E, RON RXRA). 73 种 植物 的 样本 数 

据 存储 于 SEEDLING 文件 中 . 

a 由 MINITAB 给 出 的 植物 种 类 和 种 子 丰 富 性 的 列 
联 表 如 下 . (È: NS = 无 种 子 , SA = 丰富 种 子 和 
SR = 稀少 种 子 . ) 假定 你 想 进 行 卡 方 独立 性 检验 
来 判断 种 子 丰 富 性 是 否 依赖 于 植物 种 类 . 求 列 
联 表 中 期 望 单元 计数 ,对 检验 要 求 的 假定 满 
是 吗 ? 


b. 将 种 子 丰 富 性 类 型 中 的 NS 和 SR 类 合 在 一 起 ， 
重新 构造 列 联 表 , 求 新 的 列 联 表 中 期 望 单元 计 
数 . 对 检验 要 求 的 假定 满足 吗 ? 

c. 将 植物 种 类 类 型 中 矮 灌木 类 ( dwarf shrub) 和 草 
类 ( grasses) 合 在 一 起 , 重新 构造 b 中 的 列 联 表 . 
求 列 联 表 中 期 望 单元 计数 , 满足 检验 要 求 的 假 
定 吗 ? 

d. 对 c 中 列 联 表 进 行 卡 方 独立 性 检验 , 利用 a = 
0.10, 结论 是 什么 ? 





| nous: Àbundance Columns: Type 





DwarfZhrub Grasses Herbs All 


NS 3 1 1 S 
SA 5 14 32 51 
SR 5 2 10 17 
A11 13 17 43 "73 





Cell Contents: Count 





练习 9.25 的 MINITAB 输出 
统计 表 : 丰富 性 、 种 类 


9.26 短暂 的 尘土 喷 流 . 由 农场 设备 产生 的 短暂 


尘土 喷 流 对 人 体 健 康 是 十 分 有 害 的 . 在 Journal 

of Agricultural, Biological, and Environmental Sci- 

ences(2001 年 3 月 ) 环境 工程 师 开 发 了 麦 场 开动 

的 拖拉 机 产生 的 喷 流 中 尘土 颗粒 的 浓度 模型 . 拖 

拉 机 沿 着 麦 场 6 条 平行 的 小 路 行驶 ， 一 个 带 有 

激光 光束 的 感光 仪器 放置 于 麦 场 边缘 上 ,每 隔 

0.5s 测 量 人 尘土 中 的 颗粒 物质 . 遗憾 的 是 , 测量 

的 一 小 部 分 是 删 失 的 ( 即 高 于 仪器 的 信号 水 

F), 这 种 情况 多 发 生 于 拖拉 机 距离 仪器 的 激光 

光束 很 近 的 时 候 . 下 表 给 出 了 6 条 拖拉 机 路 线 中 

删 失 测量 值 的 个 数 . 

a. 计算 并 比较 样本 中 6 条 拖拉 机 路 线 的 删 失 测量 
值 比率 . 

b. 数据 给 出 了 充分 的 证 据 表 明 6 条 拖拉 机 路 线 
的 删 失 测 量 值 比率 不 同 吗 ? 利用 a = 0.01 
检验 . 

c. 评论 检验 的 实际 和 统计 的 显著 性 . 





—————————ÀÉ——. 
拖拉 机 线路 ”无 删 失 测 量 MAWE 合计 
1 6047 175 6 222 
2 4456 236 4692 
3 6821 319 7140 
4 5889 231 6120 
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了 建立 预测 软件 模型 的 数据 集 .( 见 第 3 章 活动 
中 的 统计 学 . ) 为 NASA 太空 船 仪器 用 C 语言 





分 类 数据 分 析 
( 续 ) 
拖拉 机 线路 ”无 删 失 测量 — 删 失 测量 合计 
5 9873 480 10 353 
6 4 607 187 4 794 
合计 37 693 1628 39 321 


资料 来 源 : Johns, C. , Holmen, B. , Niemeier, A. , and 
Shumway, R. , "Nonlinear regression for modeling censored 
one-dimensional concentration profiles of fugitive dust 
plumes. " Journal of Agricultural, Biological, and Environ- 
mental Sciences, Vol. 6, No. 1, March 2001 (数据 由 合 著者 
Brit Holmen 提供 ). 


9.27 软件 缺陷 . PROMISE 软件 工程 库 , H E + 
华 大 学 信息 技术 与 工程 学 院 主持 , 为 研究 者 提供 


DEFECT * PRED EVG 交叉 表格 


Count 


= CEN 


写 的 498 个 软件 代码 模块 存储 于 SWDEFECTS 
文件 中 . 分 析 每 一 个 模块 的 缺陷 , 如 果 包 含 缺陷 
的 代码 则 分 类 为 “ 真 ”, 反之 分 类 为 “ 假 ”. 用 于 
预测 一 个 模块 是 否 有 缺陷 的 算法 是 “基本 复杂 
BE” (RRA EVG), 至 少 含有 15 个 D 结构 质数 
机 的 子 流向 图 模块 , 预测 有 一 个 缺陷 . 当 算 法 预 
SUA Bi EVG fH dE" yes"; 否则 是 

ded FS SPSS IRE mus 预测 的 EVG 
IRRA FM SPSS 输出 给 出 , 你 推荐 基本 复 
ACIE fE 9 E REALI Bbk b A ON A Barri 
解释 . 


Total 


DEFECT false 
true 
Total 


Pearson Chi-Square 
Cantinuity Correctiore 
Likelihood Ratio 
Fisher's Exact Test 
N of valid Cases 
a. Computed only for a 2x2 table 





» 


498 


b. 1 cells (25.096) have expected count less than 5. The minimum expected count is 
0.38. 


练习 9.27 的 SPSS 输出 


9.5 固定 边缘 和 的 列 联 表 


在 列 联 表 数 据 分 析 中 ， 一 个 或 多 个 类 型 可 能 包含 不 足 的 观测 值 个 数 . 为 了 说 明 这 个 问题 , 考虑 
研究 (9. 4 节 介 绍 过 ) 核 事故 发 生地 周围 地 区 居民 对 于 全 部 朴 散 的 态度 与 居住 地 离 三 哩 岛 距离 之 间 的 
关系 . 如 果 随 机 样本 中 居住 某 一 特定 距离 的 居民 数目 比较 少 ， 那么 这 一 距离 的 期 望 单元 计数 会 很 小 ， 


可 能 小 于 要 求 的 5 个 . 为 了 防止 这 种 情况 的 发 生 , 试 
验 者 经 常 固定 行 和 或 列 和 . 在 这 个 例子 中 , 通过 对 每 
个 距离 组 随机 独立 地 抽样 固定 数量 的 居民 来 固定 列 
Fn, 这样 做 可 以 提高 估计 的 期 望 单元 计数 足够 大 的 
可 能 性 . 

例如 , 假定 得 到 每 一 个 距离 组 中 100 名 居民 关于 
琉 散 态度 的 随机 样本 . 表 9.7 中 给 出 了 具体 的 结果 


表 9.7 列 总 数 固 定 的 距离 一 一 疏散 列 联 表 
与 三 哩 岛 的 距离 (英里 ) 
1~6 7~12 13 + 

全 部 ”同意 42 29 25 96 








y 
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注意 这 个 抽样 过 程 与 9. 4 节 描 述 过 程 的 差别 , 在 9.4 节 中 假定 从 所 有 居住 在 三 哩 岛 附近 的 人 口 总 体 
中 抽取 150 名 居民 的 单个 随机 样本 . 而 本 节 中 , 随机 独立 地 抽取 了 三 个 样本 , 从 每 个 距离 组 中 抽 100 
名 居民 . 所 以 , 表 9.7 中 的 数据 来 源 于 三 个 相应 于 三 种 距离 类 型 : 1 ~6 mile、7~12 mile 和 13 mile 以 
上 的 多 项 试验 , 每 个 试验 有 有 =2 个 单元 (支持 或 反对 全 部 朴 散 )， 

当 列 和 或 行 和 固定 时 , 检验 行 与 列 类 型 是 否 相关 的 卡 方 检验 同 9.4 节 的 检验 完全 相同 . 可 以 证 
8H X? 统计 量 近似 地 服从 自由 度 为 (r-1)(ec-1) 的 卡 方 抽样 分 布 (证 明 略 ), 下 面 的 框 格 给 出 了 检验 
步骤 . 例 9.5 阐述 检验 在 比较 两 个 或 多 个 二 项 比率 方面 的 应 用 . 





列 联 表 分 析 的 一 般 形 式 : 行 9 总 和 固定 的 独立 性 检验 
如 果 行 和 固定 : 
Ho: 每 个 单元 的 行 比率 不 依赖 于 该 行 ; 即 对 每 个 行 ， 列 类 型 的 观测 值 分 布 是 相同 的 . 
HB. 某 些 (或 全 部 ) 单元 的 行 比 率 依赖 于 该 行 ; 即 至 少 有 两 个 行 ， 列 类 型 的 观测 值 分 布 是 不 同 的 . 





"n 2 Ein 
检验 统计 量 ; Y= y y El 

j=l ¿=l E(n;) 
其 中 








^ n.. n, 
E(n;) =i 
n 


EAR: Y Xo 其 中 好 有 (r-1)(e-1) 个 自由 度 . 

假定 : 

1. 随机 样本 是 从 每 个 行 和 固定 的 总 体 中 选取 的 . 

2. 样本 是 独立 地 抽取 的 . 

3. 为 了 利用 X 近似 ,我 们 要 求 每 个 单元 的 估计 期 望 值 至 少 为 了 











ED 为 了 比较 三 条 生产 线 生产 的 不 合格 叶轮 比率 , 质量 控制 工程 师 从 每 条 生产 线 随机 抽取 500 
个 叶轮 ,三 条 生产 线 的 不 合格 品 数 分 别 为 12, 17 和 7. 数据 提供 了 充分 的 证 据 表明 三 条 生产 线 生产 
的 不 合格 叶轮 比率 有 差异 吗 ? 换 名 话说 ， 两 个 分 类 方向 生产 线 和 不 合格 状况 相关 吧 ? 

解 将 数据 以 列 联 表 形式 输入 MINITAB, 图 9.5 给 出 了 输出 结果 . 试验 的 目的 是 基于 三 次 独立 
的 一 项 试验 ,每 次 试验 包含 500 个 观测 值 ,比较 三 个 不 合格 的 二 项 比率 p, po 和 ps 

原 假设 是 三 条 生产 线 的 不 合格 品 比率 相同 ， 即 

Ho: pi 2 p4 =p3 
备 择 假 设 是 
Hy: 比率 p, :2 和 ps 至 少 有 两 个 不 同 . 

注意 在 原 假设 中 ,我 们 指出 不 合格 品 个 数 与 合格 品 个 数 是 与 生产 线 无 关 的 . 所 以 , 用 列 联 表 分 析 的 
卡 方 检验 来 检验 Ho: p. = p; = ps. 

估计 的 期 望 单元 计数 由 下 式 计 算 ， 





O 注意 只 需 改变 上 面 框 格 中 的 列 与 行 即 可 得 到 列 和 固定 的 X 检验 步骤 . 
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所 以 ， 
和 





上 述 结果 和 其 余 估 计 的 期 望 单元 计数 见 图 9. 5 的 MINITAB 输出 (着 重 显示 ). 





Tabulated statistics: STATUS, LINE 
Using frequencies in NUMBER 


Rows: STATUS Columns: LINE 


1 2 3 All 
DEFECT iz 17 7 36 
12 12 12 36 


NONDEF 488 483 493 1464 
480 4088 388 1464 


All SDD SOD 500 1500 
500 500 500 1500 


Cell Contents: Count 
Expected count 


Pearson Chi-Square =. 4.269, DF = 2, P-Valus * 0118 
Likelihood Ratio Chi-Square = 4.399, DF = 2, P-Value = 0.111 











图 9.5 459.5 fj MINITAB 列 联 表 分 析 


计算 的 x? 值 为 (也 见 输 出 ) : 





22 < < [n; E) 2 _ (12 - 12)2 , 07-12)? |... , (493 - 488)? 


X = " = 4.269 
jf E(n;) 12 12 488 


255 B E BL » v6 0s, HP yo. os 25.991478 (r-1) (c-1) 2 (1) (2) =2 个 自由 度 . 因 
为 计算 的 x IYF n ELSE xo os 3ER, 因为 输出 中 的 p 值 0.118 超过 了 20.05) , 所 以 没有 充 
分 的 证 据 表明 三 条 生产 线 生 产 的 不 合格 叶轮 比率 存在 差异 . 注意 我 们 并 没有 接受 H, ， 即 并 没有 
得 出 结论 pi = ps = ps, 因为 我 们 关心 犯 卫 型 错误 , 即 没有 发 现 不 合格 比率 存在 差异 , 而 实际 上 


差异 是 可 能 存在 的 . 检验 的 结论 简单 表明 如 果 差 异 存在 , 那么 为 了 发 现 这 种 不 同 , 利用 每 条 生 


产 线 上 500 个 叶轮 的 样本 太 小 了 . 
应 用 练习 的 分 类 . 在 一 次 试验 中 , 委员 会 共 评估 了 153 个 焊 


9.28 焊接 点 检查 器 的 性 能 . 西屋 电子 公司 运用 不 同 接连 接 , 其 中 111 个 接受 . 检查 器 评估 同样 的 153 
的 方法 评估 焊接 点 检查 器 的 性 能 , 一 种 方法 是 比 个 连接 ,124 个 分 类 为 接受 . 在 检查 器 拒绝 的 连接 


较 单个 检查 器 的 分 类 和 西屋 工作 标准 委员 会 专家 中 , 委员 会 同意 其 中 19 项 . 
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co 


a. 构造 一 个 汇总 委员 会 和 检查 器 分 类 的 列 
KK. 

b. 观察 a 中 构造 的 列 联 表 , 检查 器 和 委员 会 的 
分 类 之 间 存 在 关系 吗 ? 解释 . (被 委员 会 和 检 
查 器 拒绝 的 百分数 条 形 图 可 以 帮助 你 的 判 
Wr.) 

c. 对 数据 进行 卡 方 独立 性 检验 , 利用 a = 0. 05. 
用 这 个 问题 的 意义 仔细 解释 检验 的 结果 . 


.29 085 TA RON. 在 粘 合 牙齿 时 ,整形 学 家 必 


须 保持 一 块 干 燥 区 域 . 一 种 新 的 备 合 剂 ( 称 为 智能 
黏合 剂 ) 可 以 降低 干燥 区 域 的 必需 性 , 但 是 , 这 种 
新 的 恭 合剂 并 不 能 像 现在 标准 的 合成 苛 合 剂 一 样 
很 好 地 黏合 牙齿 . (Trends in Biomaterials & Artificial 
Organs, 2003 年 1 H. ) 对 由 10 个 使 用 新 黏合 剂 的 
牙齿 样本 和 由 10 个 使 用 合成 黏合 剂 的 牙齿 样本 进 
行 试验 . 在 一 小 时 干燥 之 后 确定 20 个 黏合 牙齿 的 
黏合 剂 遗留 指标 ( ARI) , 用 标 度 1 一 5 RR AE 
齿 的 残留 黏合 剂 地 ( 注 : ARI 得 分 为 1 ARAA 
合剂 都 留 在 牙齿 上 , 得 分 为 5 意味 着 没有 黏合 剂 留 
在 牙齿 上 . ) 表 格 中 列 出 了 按 5 个 ARI 类 型 的 黏合 
牙齿 个 数 的 细 分 . 











黏合 剂 遗 留 指 标 得 分 
1 2 3 4 5 
智能 黏合 剂 2 8 0 0 0 
合成 黏合 剂 1 5 3 1 0 


资料 来 源 : Sunny, J. 


vitro study with new generation ethyl cyanoacrylate ( Smart- 


, and Vallathan, A. “ A comparative in 


bond) and a composite bonding agent. " Trends in Biomateri- 
als & Artificial Organs, Vol. 16, No. 2, Jan. 2003 (X6). 


a. 解释 为 什么 列 联 表 是 固定 边缘 的 . 

b. 进行 分 析 以 判断 两 种 不 同 医 合剂 ARI 得 分 的 分 
布 是 否 有 差异 , 利用 a =0.05. 

c. 检验 的 假定 满足 吗 ? 如 果 不 满足 ， 是 如 何 影响 
由 此 检验 导出 的 推断 合理 性 ? 


-30 地 过 中 的 锰 . 在 深层 海底 矿物 核 中 发 现 了 


大 量 陆 地 上 稀少 上 且 必 须 的 金属 物质 锰 . 为 了 研究 
海底 地 壳 的 磁 龄 和 在 这 个 位 置 发 现 镭 块 概率 的 
关系 ,从 7 个 不 同 的 磁 龄 位 置 收集 地 过 样品 ,并 
记录 下 样品 中 锰 块 的 百分比 含量 , 下 表 给 出 了 
相应 的 数据 . 有 充分 的 证 据 表明 在 深海 地 过 找到 
锰 块 的 概率 依赖 于 地 壳 的 磁 龄 吗 ? 利用 a = 
0. 05 检验 . 








时 期 样品 数 锰 块 百分比 含量 
中 世纪 389 5.9 
渐 新 世 140 17.9 
始 新 世 214 16. 4 
古 新 世 84 21.4 
ELE AUR BI 247 21.1 
白垩 纪 早 中 期 1120 14.2 
侏 罗 纪 99 11.0 





资料 来 源 : Menard, H. W. "Time, chance，amd the origin of 


manganese nodules. ” American Scientist, Sept. -Oct. 1976. 


-31 双 育 药物 研究 . 由 玛 瑞 恩 默 力 陶 公司 生产 的 特 


非 那 丁 D 是 一 种 消除 喷 吐 、 鼻 塞 和 其 他 过 敏 性 鼻 
炎症 状 的 聚合 药 . 对 超过 500 名 患 有 过 人 敏 性 鼻炎 的 
患者 进行 双 盲 对 照 研究 ,以 调查 特 非 那 丁 D 的 副 
VEHI. 一 个 374 名 病人 的 样本 使 用 特 非 那 丁 D,， 另 
外 一 个 193 名 病人 的 样本 使 用 安慰 剂 ( 非 药物 ) , 
两 组 中 报告 失眠 的 病人 数 由 下 表 给 出 . 检验 并 判断 
服用 特 非 那 丁 D 的 病人 中 经 历 失眠 的 人 数 比 率 与 
接受 安慰 剂 治疗 的 病人 中 经 历 失眠 的 人 数 比率 是 
否 有 差异 , 利用 a = 0. 10. 





特 非 那 丁 D 安奈 剂 
失眠 97 12 
不 失眠 277 181 
总 计 374 193 


资料 来 源 : Marion Merrell Dow 公司 . 药剂 产品 组 . 


92 高 级 程序 评测 . 高 级 程序 语言 ( 例 C ++ For- 


tran、Algol 和 Pascal) 对 于 计算 机 操作 系统 十 分 重 
要 . 在 一 项 研究 中 , 研究 人 员 设 计 了 评测 两 种 高 级 
程序 语言 Algol 和 Pascal 的 测量 系统 , 报告 的 结果 
包含 了 几乎 相同 规模 的 典型 Algol 和 Pascal 程序 中 
不 同 种 类 语句 出 现 的 相对 频率 分 布 , 表格 给 出 了 
报告 的 百分率 信息 . 








Algol Pascal 

语句 IF 125 2045 
种 类 FOR 968 350 
IO 135 1 847 

赋值 8 923 4763 

. 其 他 261 465 

总 计 10 412 9470 


资料 来 源 : 改编 自 De Prycker, M. “On the development of a 
measurement system for high-level language program statistics. ” 
IEEE Transactions on Computers, Vol. C-31, No.9, Sept. 
1982 ,p. 888-890. 
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a. 假定 固定 两 种 程序 语言 的 边缘 ,进行 假设 检验 b. 构造 两 种 语言 中 赋值 语句 使 用 百分率 之 差 的 
判断 两 种 语言 中 不 同类 型 的 程序 语句 的 百分率 95% 置信 区 间 . 
是 否 存 在 差异 , 利用 a = 0. 05 检验 . 


"9.6 列 联 表 分 析 中 独立 性 的 精确 检验 


H F 检验 统计 量 近 似 服从 卡 方 概率 分 布 , 所 以 9. 4 节 和 9.5 节 介绍 的 列 联 表 独立 性 检验 过 程 
是 一 种 “近似 "的 检验 , 样本 容量 越 大 , 检验 的 近似 性 越 好 . 正 因为 如 此 ,上述 检 验 常 被 称 为 渐 近 检 
验 . 对 于 小 样本 ( 即 那 种 形成 的 列 联 表 中 有 一 个 或 多 个 单元 的 期 望 个 数 小 于 5 的 样本 ) , 渐 近 卡 方 检 
验 的 p 值 可 能 不 是 此 检验 实际 (精确 )p 值 的 很 好 估计 . 在 这 种 情况 下 , 可 以 利用 Fisher(1935 ) 提出 的 
方法 . 

对 于 2 x 2, 或 更 一 般 的 2 xc PIECE, 费 希 尔 开发 了 独立 性 检验 中 计算 精确 bp 值 的 方法 
为 沉 硕 尔 精确 检验 . 下 面 的 例子 说 明 这 种 方法 , 其 中 使 用 了 第 4 章 介 绍 的 超 几 何 概率 分 布 . 
用 SEE VR, 即 选 出 感染 某 些 HIV 菌株 的 方法 研发 出 一 种 新 的 有效 的 艾滋 病 疫苗 哈佛 
公共 卫生 学 院 统 计 学 家 在 Chance (2000 年 秋 ) 阐述 了 如 何 检验 HIV 表 9.8 例 9.6 的 列 联 表 
疫苗 的 有 效 性 , 表 9.8 以 2 x 2 列 联 表 形 式 给 出 了 初步 HIV 疫苗 试 ER 
验 结果 . 疫苗 用 来 消灭 一 种 称 为 “MN 菌株 ” 的 特殊 病毒 株 , 试验 包 病人 组 Wm E Ai 
& 7 名 注射 新 药物 的 艾滋 病人 和 31 名 用 安奈 剂 治疗 的 艾滋 病人 ( 没 
RH), 表 给 出 了 试验 定期 复查 期 内 MN 菌株 检验 呈现 阳性 和 阴性 和 2 9 3l 
的 病人 数 . fN 2 5 7 

a 进行 检验 并 判断 疫苗 对 治疗 HIV 的 MN 菌株 是 否 有 效 , 利用 人 3 
a =0.05. 资料 来 源 ; Gilbert, P. "Developing an 

B s wa naam 0 

c. 考虑 超 几何 概 z 





称 





71,31 
38 
(2) 
这 表示 7 名 注射 艾滋 病 疫苗 的 病人 中 2 人 检测 呈 阳性 , 31 名 没有 注射 艾滋 病 疫苗 的 病人 中 22 
人 检测 呈 阳 性 的 概率 ， 即 已 知 独立 性 的 原 假设 成 立 条 件 下 得 到 表格 中 的 概率 . 计算 此 概率 ( 称 
为 列 联 表 概率 ). 
d. 参考 c, 表 9.9a 和 9.9b 给 出 的 两 个 列 联 表 ( 与 原 表 有 相同 的 边缘 和 ) ， 与 观测 表 相 比 , 与 独立 性 原 假设 
更 矛盾 . 解释 为 什么 这 些 表 比 原始 表 提 供 了 更 多 的 拒绝 H, 证 据 ; 然后 利用 超 几何 公式 计算 每 个 表 的 概率 . 
表 9.9 例 9.6 的 备 择 列 联 表 














MN 菌株 MN 菌株 
病人 组 阳性 阴性 合计 病人 组 阳性 阴性 合计 
无 疫苗 23 8 31 无 疫苗 24 7 31 
有 疫苗 1 6 7 有 疫苗 0 7 7 
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e. 费 希 尔 精确 检验 的 p 值 是 观测 的 结果 至 少 如 原 假设 那样 与 给 定 相同 边缘 和 的 观测 列 联 
表 矛 盾 的 概率 . 将 。 和 d 中 的 概率 相 加 得 到 费 希 尔 精确 检验 的 p 值 ,在 疫苗 试验 的 背景 下 解释 
这 个 值 . 

s 

a. 如 果 疫 苗 对 治疗 HIV 的 MN 菌株 是 有 效 的 , BE Z He i A1 rh St BEER HIV 病人 比率 应 该 小 于 无 
疫苗 组 中 相应 的 比率 . 也 就 是 说 , 两 个 变量 , 病人 组 和 菌株 检验 结果 是 相关 的 . 因此 ,根据 表 9.8 数 
据 进 行 卡 方 独立 性 检验 . 图 9.6 是 分 析 的 MINITAB 输出 ,检验 的 近似 值 (输出 中 着 重 显示 的 ) 是 
0.036. 因为 这 个 值 小 于 a = 0. 05, 所 以 我 们 拒绝 独立 性 的 原 假设 ,并 得 出 结论 , 疫苗 对 于 HIV 的 MN 
菌株 检验 旦 阳性 的 病人 是 有 效 的 . 





Tabulated statistics: GROUP, STRAIN 
Using frequencies in NUMBER 
Rows: GROUP Columns: STRAIN 

NEG POS À11 


UNVACC 9 22 31 
11.42 19.58 231.00 
YACC 5 z 7 
2.58 4, 42 7.00 
ll 14 24 38 
14.00 24.00 38.00 
Cell Contents: Count 


Expected count 


Pearson Chi-Square = 4.411, DF = 1, P-Value = 0.036 
Likelihood Ratio Chi-Square = 4.289, DF = 1, P-Value = 0.038 








* NOTE * 2 cells with expected counts less than 5 





图 9.6 369.8 的 MINITAB 分 析 


b. a 中 渐 近 卡 方 检验 是 大 样本 检验 . 假定 样本 容量 足够 大 ， 使 得 期 望 单 元 计数 全 部 大 于 等 于 5. 
图 9.6 的 MINITAB 输出 着 重 显示 了 这 些 期 望 单元 计数 ， 注意 其 中 两 个 单元 的 期 望 数 小 于 5, 因此 大 
样本 假定 并 不 满足 . 所 以 , 用 此 检验 得 到 的 p 值 可 能 不 是 真实 p 值 的 可 靠 估 计 . 

e. 利用 超 几 何 分 布 , 列 联 表 概率 由 下 式 确定 : 





bs] aisi 
2/122 .215!22191! (21)(20160075) _ 
(2. ü 38! — 9669554100 =0. 043 78 


24 24114] 
d. 9.9 FRI PR ^I AER SESS EN E EL PE PO E 95 E ACC 分别 为 1 名 和 0 名 病人 ) 少 于 
表 9. 8 的 列 联 表 (2 名 病人 ). TE, 在 这 些 备 择 表 中 检测 呈 阳 性 的 注射 疫苗 的 病人 比率 (分 别 
是 1/24 = 0. 042 和 0/24 =0. 000) 小 于 实际 研究 中 相应 的 比率 (2/24 = 0. 083). 从 而 , 备 择 表 中 
检测 呈 阳 性 的 注射 疫苗 与 没有 注射 疫苗 的 病人 比率 之 差 大 于 原始 表 中 的 比率 . 因为 独立 性 原 假 
设 意味 着 检测 呈 阳 性 的 病人 比率 对 两 种 病人 组 之 差 是 相同 的 ， 所 以 这 两 个 列 联 表 比 原始 表 提 
供 了 更 多 的 拒绝 H, 证 据 . 
在 已 知 独立 性 原 假设 为 真 条 件 下 , 表 9. 9a 得 到 的 概率 ( 即 表 9. 9a 中 的 列 联 表 概率 ) 是 
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74431 7! 31! 
RBI 6!23! 8! _ (7) (7 888 725) 














38| — 38! ~ 9669554100 ^9 00571 
(a) 241 141 
类 似 地 , 表 9. 9b 的 列 联 表 概 率 是 ， 
bp 
! 7! ! 7! 2 629 57 
r^ = Ei ü SI IU 70.000 27 
[24] 241 141! 


e. 为 了 得 到 费 希 尔 精确 检验 的 p 值 ， 考虑 至 少 如 观测 的 列 联 表 那 样 给 出 与 原 假设 矛盾 结 
果 的 所 有 可 能 的 列 联 表 概 率 ， 并 将 这 些 列 联 表 概率 加 起 来 . 因为 表 9.9 的 列 联 表 只 是 给 出 了 
矛盾 结果 的 两 种 可 能 表 , 我 们 将 表 o. o 的 超 几 何 概率 与 表 9. 8 的 超 几 何 概率 相 加 得 到 独立 
性 检验 的 精确 p É: p 值 =0.04378 +0. 00571 + 0. 00027 = 0. 04976. 因为 这 个 精确 的 p Ë 
小 于 a=0.05, 我 们 拒绝 独立 性 原 假设 ; 有 充分 的 证 据 得 出 疫苗 对 治疗 HIV 的 MN 菌株 有 效 
的 可 靠 结论 . 

利用 统计 软件 很 容易 得 到 这 个 检验 的 费 希 尔 精确 p f, p fË =0. 04976 —-0. 050. 这 个 值 由 图 9.7 
的 SPSS 输出 最 后 列 “Exact Sig( 1-sided) " ( 着 重 显示 ) 给 出 . ( 注 : SPSS 输出 也 给 出 了 双 侧 独立 性 检验 
的 精确 p 值 , 这 个 值 是 0.077, 是 17 名 没 注射 疫苗 且 检 测 呈 阳性 的 病人 和 7 名 注射 疫苗 且 检 测 呈 阳 
性 的 病人 构成 的 第 4 个 列 联 表 的 超 几何 概率 与 单 侧 精确 p 值 相 加 而 得 . 在 问题 解决 过 程 中 我 们 并 没 
有 考虑 这 个 表 , 因为 这 会 导致 与 疫苗 组 中 阳性 HIV 病人 比率 小 于 没有 注射 疫苗 组 比率 的 备 择 假 设 巴 
盾 的 样本 比率 . ) 

2x 2 列 联 表 的 费 希 尔 精 确 检验 汇总 在 下 面 的 框 格 中 。 对 于 更 一 般 的 2 x c 列 联 表 的 详细 讨论 ， 
参考 本 章 的 参考 文献 . 

GROUP ' MNSTRAIN Crosstabulation 


o 
22 


GROUP  UNVAC Count 8 
Expected Count 114 19.6 31.0 

VACC Count 
Expected Count 

Total Count 
Expected Count 
















Pearson Chi-Square 
Continuity Correctior& 
Likelihood Ratio 
Fisher's Exact Test 


Asymp. Sig. | ExactSig. | Exact Sig. 
df 2-sided 2-sided 1-sided 
1 
N of Valid Cases 


0.036 
1 0.096 
1 0.038 
0.077 
a. Computed only for a 2x2 table 


b. 2 cells (50.096) have expected count iess than 5. The minimum expected count is 
2.58. 











图 9.7 3€9.8 WJ SPSS 列 联 表 分 析 
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2x 2 列 联 表 独 立 性 的 费 希 尔 精 确 检验 
假定 2 x2 列 联 表 有 如 下 形式 
列 1 列 2 行 和 
行 1 nu Dj n. 
172 nj ny ng. 
列 和 n.i n. n 
步骤 1 利用 超 几 何 分 布 公式 计算 观测 的 列 联 表 概 率 : 


G6. GG] 
GJ C) 





概率 = 





步骤 2 ”构造 与 观测 表 具 有 相同 议 缘 和 的 所 有 可 能 的 2 x 2 列 联 表 . 

利用 超 儿 何 公式 计算 步骤 2 中 每 个 列 联 表 的 概率 . 若 某 个 列 联 表 概率 小 于 或 等 于 观 浏 表 概 率 ， 
那么 这 个 列 联 表 至 少 如 观测 表 一 样 与 独立 性 的 原 假设 相 矛盾 . 

计算 至 少 如 观测 表 一 样 与 独立 性 愿 假设 相 矛 盾 的 所 有 列 联 表 概 率 之 和 . ( 注 ; 和 中 包括 观测 表 
的 概率 . ) 这 个 和 表示 双 侧 检验 的 费 希 尔 精 确 p 值 . 


步骤 3 


步骤 4 








应 用 练习 

9.33 饮用 水 质量 研究 . 参考 练习 1.9, Disasters ( 2004 
年 第 28 期 ) 刊 登 了 一 篇 关于 热带 气旋 对 一 个 偏远 
太平 洋 岛屿 饮用 水 质量 影响 的 研究 . 研究 的 一 部 分 
是 评估 简单 的 纸 条 一 硫化 氢 ( HS) 试 纸 在 判断 水 中 
是 否 存在 屎 肠 球 菌 方面 的 效用 .〈 注 : 当 水 中 存在 屎 
肠 球 菌 时 , HS 试纸 变 黑 . ) 在 亚 美 旋 气 经 过 岛屿 之 
后 三 天 获取 了 17 瓶 水 样品 (500 mL) 用 于 检测 屎 肠 
球菌 , 每 瓶 水 样本 都 进行 了 传统 的 数 生 大 肠 杆菌 群 
检测 和 简单 的 ELS 检测 , 检测 结果 见 下 表 . 











传统 细菌 检测 

有 无 

HS Am 7 4 
检测 结果 REN 0 6 


资料 来 源 : Mosley, L. , Sharp, D. and Singh, S. “ Effects of 
a tropical cyclone on the drinking-water quality of a remote Pa- 
cific island. " Disasters, Vol. 28, No. 4, 2004 ( 33). 


a_ 解 释 在 确定 H,S 检测 结果 是 否 依赖 于 水 样品 中 是 
否 存 在 细菌 时 , 为 什么 必须 用 费 希 尔 精确 检验 . 

b. 构造 与 观测 表 具 有 相同 边缘 和 的 所 有 可 能 的 列 
联 表 . 

o 利用 超 几何 公式 计算 b 中 每 个 表 的 概率 , 指出 


概率 小 于 等 于 观测 表 概率 的 列 联 表 , ( 这些 表 比 
原始 表 提 供 了 更 有 说 服 力 的 证 据 拒绝 独立 性 的 
原 假设 . ) 

d. 计算 。 中 指出 的 列 联 表 的 超 几何 概率 之 和 ,这 
个 和 表示 费 希 尔 精确 检验 的 p 值 . 

e. 研究 人 员 认为 “HS 检测 结果 与 传统 的 六 生 大 肠 
杆菌 群 检测 结果 很 好 地 一 致 你 同意 吗 ? 利用 
a=0. 10 检验 . 


9.34 软件 错误 . 参考 练习 9.27, 关于 预测 为 NASA 


太空 船 仪器 用 C 语言 编写 软件 代码 中 缺陷 的 研究 . 
两 个 类 型 变量 (真实 的 缺陷 状况 和 使 用 EVG 预测 
的 缺陷 状况 ) 的 SPSS 列 联 表 在 下 面 给 出 . 


DEFECT * PRED EVG Crosstabulation 
Count 


ET [一 


Total 
DEFECT false 
true 





Total 
练习 9. 34 的 SPSS 输出 


a. 证明: 一 共有 11 种 可 能 的 列 联 表 ( 包 括 观测 表 ) 
与 观测 表 有 相同 的 边缘 和 |. 

b， 利 用 超 几 何 公式 计算 a 中 11 个 列 联 表 的 概率 . 

c. 根据 b 中 的 概率 , 计算 独立 性 费 希 尔 精确 检验 
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的 p 值 . 利用 SPSS 输出 的 p 值 证 明 你 的 结果 . 

d. 因为 样本 容量 较 大 , 渐 近 卡 方 检验 的 p 值 应 该 
近似 地 等 于 费 希 尔 精确 检验 的 p (B. 这 个 结论 
成 立 吗 ? 

.35 4665 f 4k. 参考 练习 9.29, Trends in 
Biomaterials & Artificial Organs (2003 4E 1 H ) * F 
一 种 新 的 牙齿 黏合 剂 的 研究 , 这 种 新 的 黏合 剂 ( 称 
为 智能 黏合 剂 ) 与 标准 的 合成 黏合 剂 进行 比较 . 分 
别 测 量 了 10 个 使 用 新 黏合 剂 的 牙齿 和 10 个 使 用 
合成 黏合 剂 的 牙齿 的 医 合 剂 遗 留 指 标 ( ARI) ,数据 
的 列 联 表 如 下 . 

a 解释 为 什么 独立 性 费 希 尔 精确 检验 可 以 (应 该 ) 


用 于 这 个 列 联 表 . 
b. 下 面 给 出 了 列 联 表 分 析 的 SAS 输出 , 利用 输出 
中 的 信息 进行 费 希 尔 精确 检验 ,a =0. 05. 











黏合 剂 遗 留 指标 得 分 
1 2 3 4 5 
智能 黏合 剂 2 8 0 0 0 
合成 黏合 剂 1 5 3 1 


资料 来 源 : Sunny, J. , and Vallathan, A. “A comparative in 
vitro study with new generation ethyl cyanoacrylate ( Smart- 
bond) and a composite bonding agent. " Trends in Biomateri- 
als & Artificial Organs, Vol. 16, No. 2, Jan. 2003 (36). 


Chi-Square Tests 






Pearson Chi-Square 1.188b 
Cantinuity Correctiore 0.306 
Likelinood Ratio 0.948 
Fisher's Exact Test 
N of Valid Cases 498 

a. Computed only for a 2x2 table 














Asyrnp. Sig. 
2-sided 


Lo o [ome e | 






Exact Sig. | Exact Sig. 
2-sided 1-sided 





D. 1 cells (25.0%) have expected count less than 5. The minimum expected count is 
0.98. 





The FREQ Procedure 
Table of ADHESIVE by ARI 

















Pr <= P 





fiDHES I UE ARI 

Frequency 

Expected 1 3 4 Total 

COMPOS I TE 1 5 3 1 10 
1.5 6.5 t.5 0.5 

SMARTBOND 2 8 0 0 10 
1.5 6.5 1.5 0.5 

Total 3 13 3 1 20 

Statistics for Table of ADHESIVE by ARI 

Statistic DF Value Prob 

Chi -Square 3 5.0255 0.1599 

Likelihood Ratio Chi-Square 3 5.5836 0.0854 

Mantel-Haenszel Chi-Square 1 3.48998 0.0517 

Phi Coefficient 0.5013 

Contingency Coefficient 0.4481 

Cramer's U 0.5013 


HARNING: 75X of the cells have expected counts less 
than S. Chi-Square may not be a valid test. 


Fisher's Exact Test 





Table Probability (P) 


Sample Size = 20 


0.0203 
9.2515 








5&2] 9.35 的 SAS 输出 








340 gos 
快速 回顾 
重要 公式 
单 向 表 


205 [RO cB) 
Pi 的 置信 区 间 : Pi s a PO 


IE: (b, -P pi(1 -Pi) +b; (1 - 55) *25j5; 
Pi 一 Pj 的 置信 区 间 : (p; — pj) sl ; ; p 








检验 统计 量 : 


其 中 , n; = 单元 i 的 计数 ; E(n;) =npio; pio = Ho HP p; 的 假设 值 . 


双向 表 
检验 统计 量 : 
X < y uÊ? 
E(n;) 
NN 
*2 x 2 列 联 表 的 概率 : p= ni / Vna 


(i) 


其 中 ,ny = 第 i 行 第 j 列 单元 的 计数 ; E(ny) =ni. n y/n, m, = 88 41, n = PURI, n= 总 的 样本 容量 





符号 汇集 
M LLLA 
符 号 读 法 说 — H 
Pio p-i-0 H, 中 多 项 概率 p, 的 假设 值 
x 卡 方 用 于 分 析 计 数 数据 的 检验 统计 量 
n; n-i 单 向 表 中 单元 i 观测 的 结果 数 
E(n;) e-n-i 当 H RAR, MARAN i 期望 的 结果 数 
Pj p-ij 双向 表 中 :i 行 j 列 单元 结果 的 概率 
n; n-i-j 双向 表 中 i 行 j 列 单元 观测 的 结果 数 
Een) 售 计 的 emi 双向 表 中 : 行 j 列 估计 的 期 望 结果 数 
ni. n-i- 列 联 表 第 i 行 结果 和 
n. nj 列 联 表 第 j 列 结果 和 
下 CC 不 和 
本 章 简要 提示 


e 多 项 数据 是 落 入 两 个 以 上 类 型 、 组 或 单元 的 定性 数据 . 
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9. 


OO 


° 多 项 试验 的 性 质 : (1) n 次 相同 的 试验 ; (2) 每 次 试验 有 上 种 可 能 的 结果 ; (3) 每 次 试验 的 
种 结果 的 概率 都 相同 ; (4) 试验 是 独立 的 ; (5) 感 兴趣 的 变量 是 单元 计数 . 


e 单 向 表 是 单个 定性 变量 的 汇总 表 . 


e 双向 表 或 列 联 表 是 两 个 定性 变量 的 汇总 表 . 


° R7 (x° ) 统计 量 用 于 检验 与 单 向 表 和 双向 表 关 联 的 概率 . 、 
° 有 效 的 X 检验 要 求 的 条 件 : (1) 多 项 试验 ;(2) 样本 大 小 n 充分 大 一 一 当期 望 单元 计数 全 都 


大 于 或 等 于 5 时 满足 . 


° 双向 表 显 著 的 x” 检验 意味 着 两 个 定性 变量 是 相关 的 . 
* 独立 性 卡 方 检验 不 能 用 于 推断 两 个 定性 变量 间 存 在 某 种 因果 关系 
。 费 希 尔 精确 检验 可 以 用 于 2 x2 或 更 一 般 的 2 x c IER. 


(全 补充 应 用 练习 


( 注 : 标 有 * 号 的 练习 要 求 本 章 选 学 节 的 方法 , ) 
36 不 合适 住院 . New England Journal of Medicine 
(1986 4E 11 H 13 H ) 发现 相当 一 部 分 急诊 治疗 是 
没有 必要 的 . 医师 们 研究 了 全 国 6 个 不 同 地 区 1 132 
名 住院 病人 的 病历 , 样本 中 60% 的 人 院 认为 是 应 
VA, 23% 认 为 是 不 应 该 入 院 , 剩余 17% 经 过 门诊 手 
术 也 可 以 避免 人 院 . B p, p; HI p, 分 别 代表 三 种 
类 型 : 应 该 、 不 应 该 和 通过 门诊 手术 可 以 避免 的 真 
实 人 院 百 分 数 . 

a Hj 95% 置信 区 间 估 计 pi, p, Hl p, 解释 

结果 . 

b. 检验 H: p, = 0.8, p, = 0.1, p, 20.1, #J 

用 a = 0. 10. 


.37 压缩 周 工作 时 间 . 压缩 周 工作 时 间 定 义 为 “ 另 


一 种 工作 安排 , 交换 每 天 的 工作 小 时 数 与 每 周 的 
工作 天 数 , 为 了 在 少 于 5 天 内 达到 标准 的 周 工作 小 
时 数 . ”一 项 实地 研究 在 某 个 大 型 、 中 西部 、 连 续 运 
行 (7 天 /24 小 时 ) 的 化 工厂 进行 , 共有 4 种 不 同 的 


工作 安排 , 其 中 两 个 是 压缩 的 : 


3 个 8 h HEHH 2^ 12 h jg se gr 
、 (12A. M. ~12P. M. , 
CHR, 晚上、 半夜 ) 12P. M. ~12A. M. ) 
3 个 8h 循环 轮班 2 个 12 h 循环 轮 班 


SER 671 名 小 时 工 根据 他 们 的 喜好 对 4 种 工作 安 
排 排序 , 下 表 给 出 了 每 一 种 工作 安排 被 排 在 第 一 
位 的 次 数 , 有 充分 的 证 据 表明 小 时 工 对 某 一 种 工 
作 安 排 更 加 偏好 吗 ? 利用 a =0. 01 检验 . 


8 h 固定 8 h 循环 


389 54 


12 h 固定 12 h 循环 


9.38 电脑 侵权 . 最 近 , 研究 人 员 经 过 4 年 时 间 完 成 


了 对 电脑 侵权 的 研究 . 下 表 给 出 的 是 按 年 核实 的 4 
类 侵权 数 , 数据 提供 了 充分 证 据 表明 不 同 侵权 行 
为 的 比率 随时 间 改 变 吗 ? 利用 a =0. 05 检验 . 








侵权 种 类 
金融 诈骗 。 盗 取 信息 或 财富 “未 经 授权 的 。。 破坏 行为 ei 
; um 信息 使 用 MT 
1 7 5 9 8 29 
2 22 18 6 6 52 
年 3 12 15 6 12 45 
4 21 15 16 9 61 


合计 62 53 37 35 187 


9. 


39 原子 武器 暴露 . 美国 橡树 岭 (田纳西 ) 国家 实 
验 室 的 研究 人 员 研 发 一 种 算法 估计 在 20 世纪 50、 
60 年 代 内 华 达 试验 基地 暴露 于 原子 武器 试验 的 人 


们 在 生命 中 出 现 甲 状 腺 癌 病 例 的 期 望 数 与 超过 数 . 
( Health Physics ,1986 年 1 H. ) 在 大 约 23 000 名 暴 
露 于 武器 试验 辐射 的 人 群 中 , 58 人 有 可 能 在 他 们 


342 


pot 





的 剩余 寿命 中 患 有 甲状 腺 癌 . 根据 算法 , 将 58 个 
病例 按 性 别 和 不 同 暴露 时 间 的 辐射 水 平 (放射 能 剂 
量 ) 分 类 见 下 表 , 假定 数据 表示 来 源 于 目标 总 体 的 
58 名 甲状 腺 癌 患 者 的 随机 样本 . 进行 检验 判断 类 
型 两 个 方向 : 性 别 和 暴露 时 间 的 放射 能 剂量 是 否 
独立 , 利用 a =0.01. 





性 别 








合计 
男性 女性 
小 于 1 6 13 19 
辐射 剂量 — 1-10 8 18 26 
大 于 或 
eu 3 10 13 


合计 17 41 58 
c 
资料 来 源 : Zeighami, E. A. , and Morris, M. D. * Thyroid 


cancer risk in the population around the Nevada test site. ” 
Health Physics, Vol. 50, No. 1, Jan. 1986, p. 26( € 2). 


.40 £ BE P d 3084878... 闲置 的 加 利 福 尼 亚 果园 中 
使 用 氯 里 硫 磷 、 地 亚 农 、 杀 扑 磷 和 对 硫 磷 这 四 种 杀 
W. Environmental Science & T. echnology( 1993 4E. 10 
月 ) 报 道 了 1990 年 1 JH 2: 6 月 期 间 这 些 杀菌 剂 在 
加 利 福 尼 亚 的 使 用 次 数 . 下 表 给 出 了 三 种 水 果 或 坚 
果 果 园 的 数据 分 布 情况 . (对 硫 磷 已 被 禁用 于 落叶 


果树 和 坚果 树 . ) 
a 进行 检验 (a =0.01) 判断 使 用 的 杀 虫 剂 是 否 与 
果园 种 类 有 关 ， 


b， 由 于 大 量 的 杀 虫 剂 应 用 报告 所 以 a 中 检验 的 
样本 总 容量 十 分 大 (n =417 697) , 从 而 “统计 显 
著 " 的 结果 不 一 定 是 “实际 显著 ”. 分 析 说 明 对 于 
三 种 果园 种 类 , 杀 扑 磷 的 应 用 比例 存在 巨大 








差异 . 
——  _ _ 
水 果 / 坚 果树 
化 学 剂 
杏仁 桃 3 B 

氧 里 硫 磷 41 077 4419 11 594 
地 亚 农 102 935 9 651 5928 
AF 21 240 5198 1790 
bp. 136 064 53 384 24417 


资料 来 源 : Selber, J. N. , et al. “Air and fog deposition resi- 
dues of four organophosphate insecticides used on dormant or- 
chards in the San Joaquin Valley, California. " Environmental 
Science & Technology, Vol. 27, No. 10, Oct. 1993, p. 2236 
CR 1). 


9.41 CASE 技术 . 参考 练习 6.83, 用户 对 于 计算 


机 辅助 软件 工程 (CASE) 技术 的 满意 度 研究 
(Journal of Systems Management, 1989 年 7 H). 
调查 CASE 用 户 样本 中 每 个 用 户 在 工作 中 使 用 
数据 流程 图 的 频繁 性 和 对 于 他 们 使 用 的 设计 图 
表 技 术 的 满意 度 , 这 里 给 出 了 列 联 表 中 每 个 单 
元 响应 的 百分比 . 假定 1 000 个 CASE 用 户 参 加 
了 该 项 研究 , 分 析 调 查 数据 . 


数据 流程 ”用 户 对 设计 图 表 技术 的 满意 度 








fi 
图 的 使 用 满意 不 满意 
总 是 27.5 0.0 27.5 
大 部 分 时 间 31.3 2.5 33. 8 
偶尔 31.2 3.8 35.0 
从 不 2.5 1.2 3.7 
合计 92.5 7.5 100.0 


资料 来 源 :; Kievit, K. , and Martin, M. “ Systems analysis 
tools-Who” s using them?” Journal of Systems Management , Ju- 
ly 1989, p. 29( 表 6). 


9.42 X33345 n. 亲密 的 敌人 识别 (DER) 是 


自然 学 家 和 生态 学 家 使 用 的 术语 , 用 来 描述 鸟 类 、 
哺乳 动物 和 蚂蚁 在 它们 领地 边界 被 同类 侵犯 时 表 
现 的 攻击 性 行为 ,， DER 经 常 伴随 着 对 人 侵 动物 的 
升级 攻击 . 最 近 的 研究 表明 红 背 火 晰 蝎 由 利用 化 学 
信号 从 不 熟悉 的 火 蜥 蝎 中 区 分 熟悉 的 ， 而 使 用 
DER. 在 逐步 升级 的 争斗 中 , 火 蜥 蝎 努 力 咬 对 手 的 
鼻子 一 这 个 伤口 会 降低 火 蜥 蝎 区 分 牺牲 品 、 配 
偶 和 领土 竞争 者 的 能 力 . 研究 的 一 部 分 集中 在 比较 
鼻子 上 有 伤口 的 雄性 和 峻 性 的 比率 ,从 森林 中 收 
集 144 RHD, RECN, REAT LHRH 
织 . 下 面 的 表格 给 出 了 观察 的 结果 . 


r 
雄性 HEHE 合计 








鼻子 上 有 疤痕 组 织 5 12 17 
鼻子 上 无 疗 痕 组 织 76 51 127 
合计 81 63 144 

—— H 9 6 114 — 


资料 来 源 : Jaeger, R. G. “Dear enemy recognition and the costs 
of aggression between salamanders. " The American Naturalist ; 
June 1981, Vol. 117, pp. 962-973. Reprinted by permission of the 
University of Chicago Press. (C) 1981 The University of Chicago. 


a. HARIRA AF ARORAA BEAR 
雄性 和 肉 性 的 比率 是 否 存在 差异 , 利用 oa =0.01. 
b. 用 99% 置信 区 间 估 计 鼻子 上 有 疤痕 组 织 的 火 晰 
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蝎 中 雄性 和 上 峻 性 的 比率 之 差 , 解释 结果 . 
c. 对 数据 应 用 费 希 尔 精 确 检 验 , 同 a 中 的 检验 结 
果 比 较 . 


.43 视频 时 间 压 缩 . 视频 工程 师 使 用 时 间 压 缩 技术 


来 缩短 播放 电视 广告 节目 所 要 求 的 时 间 . 但 是 较 短 
的 广告 有 效 吗 ? 为 了 回答 这 个 问题 , 将 200 名 大 学 
生 随 机 分 为 三 组 . 第 一 组 (57 名 学 生 ) 观看 一 个 包 
含 30s 广告 的 电视 节目 录像 带 ; 第 二 组 (74 名 学 
生 ) 观 看 同样 的 录像 带 , 但 是 24 s 时 间 压 缩 版 本 的 

广告 ; 第 三 组 (69 名 学 生 ) 观 看 20 s 时 间 压 缩 版 本 

的 广告 . 观看 录像 带 两 天 之 后 , 询问 这 三 组 学 生 广 

告 中 品牌 的 名 称 . 下 面 表格 中 给 出 了 每 组 学 生 回 答 

情况 的 人 数 . 

a. 数据 提供 了 充分 的 证 据 (a = 0.05) 表明 两 个 分 
类 方向 : 广告 类 型 和 回忆 品牌 名 称 是 相关 的 ? 
解释 结果 . 

b. 构造 正常 版 本 和 24 s 压缩 版 本 广告 中 能 回忆 起 
品牌 的 学 生 比 率 之 差 的 95% 置信 和 区间. 











广告 类 型 
正常 版 本 压缩 版 本 1 压缩 版 本 2 合计 
(30 s) (24 s) (205) F 
回忆 品 能 15 32 10 57 
牌 名 称 否 42 42 59 143 
合计 57 74 69 200 


.44 煤 与 核能 . 为 了 在 未 来 给 顾客 发 电 , 电气 公共 


事业 公司 必须 在 两 种 技术 : 煤 或 者 核能 中 作出 选 
FR. 为 了 评估 当地 居民 的 态度 , 电力 公司 进行 了 一 
次 公共 意见 调查 . 考虑 4 个 部 门 : 新 闻 媒 体 、 煤 矿 
工人 联盟 、 环 境 保护 论 者 和 自然 资源 保护 论 者 及 
地 方 组 织 , 从 每 个 部 门 随机 抽取 50 人 , 询问 他 们 
的 意见 . 调查 结果 如 下 . 


新 闻 ”煤矿 工人 环境 保护 论 





地 方 a, 
者 和 自然 资 合计 
媒体 联盟 源 保护 论 者 组 织 
支持 选择 煤 — 21 42 11 25 99 
支持 选择 核能 18 2 16 1 49 
PZ 11 6 23 12 52 
合计 50 50 50 50 200 





a 对 于 未 来 发 电 技 术 选 择 的 公众 意见 , 4 个 组 之 间 
相同 吗 ? 利用 a =0. 10 检验 . 
b 对 煤 的 选择 是 否 显 示 比 核能 选择 有 更 多 的 总 的 


支持 , 利用 a = 0. 10 检验 . 
c. 构造 支持 核能 的 环境 保护 论 者 和 自然 资源 保护 
论 者 百分比 的 90% 置信 区 间 . 


.45 决策 支持 系统 . 决策 支持 系统 (DSS) 是 一 种 用 


于 帮助 管理 和 分 析 大 型 数据 集合 的 计算 机 系统 . 理 
想 地 ，DSS 应 该 包括 4 个 部 分 : (1) 数据 选取 系 
统 ; (2) 关 系数 据 库 组 织 ; (3) 分 析 模 型 ; (4) 用 
户 与 系统 之 间 的 友好 交互 对 话 . 最 近 州 高 速 公路 局 
安装 DSS 以 帮助 监测 公路 建设 合同 投标 中 的 数据 ， 
作为 自我 检测 的 一 部 分 , 公路 局 选取 151 个 最 近 发 
生 的 可 以 直接 被 DSS 跟踪 的 问题 , 并 根据 产生 问 
题 的 部 分 分 类 . 从 表 中 的 数据 能 得 出 4 个 DSS 部 分 
中 至 少 有 两 个 部 分 问题 的 比率 是 不 同 的 结论 吗 ? 
利用 a = 0. 05 检验 . 

部 分 1 2 3 4 

问题 数 31 28 45 47 





'9.46 收音 机 听众 特点 . 进行 试验 比较 收音 机 听众 


的 忠诚 度 和 选择 性 , 测试 30 名 听众 并 对 两 种 类 型 
中 的 每 一 类 型 按 低 或 高 进行 分 类 . 表 中 的 数据 能 提 
供 充 证 据 表 明 忠 诚 度 和 选择 性 间 存 在 相关 性 吗 ? 
使 用 a 20. 05 的 费 希 尔 精确 检验 . 











.47 M&Ms 颜色 . M&Ms 的 普通 巧克力 糖 有 6 种 


颜色 : 褐色 、 黄色、 红色 、 酉 黄色 、 绿 色 和 黄 宰 
色 . 根据 生产 商 ( 玛 氏 食品 股份 有 限 公 司 ) 声 明 ， 
在 每 批 大 量 产品 中 , 颜色 比例 分 别 为 30% 褐色 、 
20% 黄色 、20% £L& , 10% WREE, 1096 绿色 和 
1090 黄 褐色 . 为 了 检验 这 个 声明 , 卡尔 顿 学 院 
(明尼苏达 ) 的 教授 让 学 生计 算 “ 娱 乐 容量 ” 包 中 
M&Ms 颜色 (Teaching Staistics, 1993 年 春 ), 370 
个 M&Ms 的 结果 由 下 表 给 出 . 构造 检验 以 判断 
颜色 的 真实 百分比 与 生产 商 声 明 的 百分比 是 否 
不 同 . 利用 a = 0. 05. 

颜色 A 黄 a 橘红 g GR 合计 
M&Ms 
DB — —  — — 
资料 来 源 : Johnson, R. W. “ Testing colour proportions of 
M&M' s. " Teaching Statistics, Vol. 15, No. 1, Spring 1993 , 
p. 2C 1). 


84 79 75 49 36 47 370 


9.48 工人 事故 比例 . 工伤 趋势 依赖 于 工人 已 经 执行 
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任务 的 时 间 长 度 吗 ? 生产 商 对 714 名 受伤 工人 进 a 数据 表明 在 某 些 时 间 段 工人 发 生 事故 的 概率 高 


行 分 析 , 表格 中 给 出 了 在 8 h 内 每 1 个 小 时 时 段 工 于 其 他 时 间 段 吗 ? 利用 a =0. 10 检验 . 
伤 的 分 布 . b. 数据 提供 充分 证 明 表明 在 后 4 发 生 事故 的 概 


率 高 于 前 4 h 吗 ? 利用 w =0. 10 检验 . (提示 : 


NBS 8 ` 
工作 小 时 1 2 3 4 5 6 7 检验 Hy: p, =0.5, 这 里 pi 是 后 4h 发 生 事故 的 
事故 数 93 71 79 72 98 89 102 110 概率 . ) 


活动 中 的 统计 学 : 公众 对 工程 师 和 工程 的 看 法 

2003 年 由 联合 工程 基金 会 授权 , 美国 工程 师 学 会 联合 会 (AAES ) 雇用 哈里 斯 互动 公司 调查 美国 
公众 对 工程 的 知识 和 兴趣 . 主要 目的 是 将 2003 年 调查 结果 与 1998 年 调查 结果 进行 比较 , 另外 ， 
AAES 想 要 知道 美国 公众 是 否 清楚 工程 师 是 做 什么 的 以 及 他 们 可 以 通过 何 种 信息 渠道 学 习 工程 . 

哈里 斯 在 2003 年 民意 调查 中 使 用 的 调查 方法 跟 1998 年 使 用 的 方法 相同 , 对 1000 名 随机 选取 的 
成 年 人 样本 进行 电话 访问 . 为 了 保证 样本 有 广泛 的 代表 性 , 使 用 分 层 随 机 抽样 , 即 在 国家 的 不 同 区 
域 的 中 心 城市 、 郊 区 和 都 市 地 区 随机 选取 成 年 人 样本 . 

表 SIA9. 1 在 2003 年 美国 群众 对 工程 的 调查 中 提出 的 一 些 问题 
Q1; 请 告诉 我 们 你 对 下 述 关于 工程 师 的 论述 有 多 少 同 意 : 
a. 工程 师 对 我 们 的 高 水 平生 活 负 有 主要 责任 . 


b. 工程 师 对 创造 有 害 于 社会 的 事物 负 有 责任 . 
CER: 完全 同意 、 部 分 同意 、 部 分 反对 、 完 全 反对 . ) 


Q2: 如 果 你 有 一 个 儿子 或 女儿 选择 工程 作为 职业 , 什么 原因 使 你 感到 高 兴 ? 


Q3: 请 告诉 我 们 在 下 列 创造 物 中 , 你 认为 工程 师 的 参与 程度 如 何 : 
a 高 速 公 路 . R, ROGH. b. 太空 船 . EPL d 因特网 ，e。 核 技术 . 
(答案 : 完全 参与 、 部 分 参与 、 不 总 是 参与 、 从 不 参与 . ) 

Q4 : 你 对 工程 和 工程 师 了 解 程度 如 何 ? 
CER: 非常 了 解 、 一 般 了 解 、 并 不 很 了 解 、 完 全 不 了 解 . ) 

Q5: 你 有 多 大 的 可 能 性 阅读 关于 使 用 电池 而 不 是 汽油 的 混合 动力 车 的 发 展 文章 ? 
(CER: 绝对 必然 、 很 有 可 能 、 有 可 能 、 没有 可 能 .) 

Q6; 你 使 用 何 种 媒体 资源 获得 关于 工程 和 工程 师 的 信息 ? 
(答案 : 有 线 电视 新 闻 、 地 方 电视 新 闻 、 地 方 报纸 、 因 特 网 、 其 他 ，) 





在 2003 年 12 月 1 日 至 12 月 14 日 间 进 行 电话 访问 , 平均 每 个 访问 时 长 15 min, 表 SIA9. 1 列 出 
了 电话 访问 中 涉及 的 几 个 问题 抽样 . 另外 , 收集 每 位 受 访 者 人 口 统计 学 信息 ,如 性 别 、 年 龄 、 受 教育 
程度 和 认识 的 工程 师 人 数 . 

在 这 个 活动 中 的 统计 学 , 我 们 集中 研究 对 问题 Qlb 和 Q6 的 回答 , 表 SIA9. 2 和 SIA9. 3 给 出 了 回 
答 的 汇总 . 很 明显 , 回答 按 性 质 分 类 , 从 而 , 我 们 使 用 本 章 介绍 的 方法 分 析 它 们 . 

首先 , 考虑 对 问题 “工程 师 对 创造 有 害 于 社会 的 事物 负 有 责任 . ”的 回答 (Q1b). 回答 的 汇总 见 表 
SIA9. 2a, 这 是 一 个 单 向 表 . 可 以 利用 这 些 结果 确定 4 种 回答 类 型 (完全 同意 、 部 分 同意 、 部 分 反对 和 
完全 反对 ) 所 占 的 百分比 是 否 不 同 . 图 SIA9. 1a 给 出 了 数据 的 SPSS 单 向 表 卡 方 分 析 , SPSS 输出 着 重 
显示 给 出 了 检验 统计 量 (X? = 150. 5) 和 检验 的 p fi (p 值 =0.000). 所 以 , 我 们 有 充分 (a =0.01) 的 证 
据 表明 4 种 回答 类 型 的 真实 百分比 是 不 同 的 . 图 SIA9. 1a 顶部 的 样本 百分比 表明 大 部 分 公众 ( 约 
67% ) 不 同意 这 种 说 法 . 

为 了 确定 对 问题 Qlb 的 同意 /反对 水 平 是 否 依赖 于 其 他 元 素 , 如 性 别 、 受 教育 程度 和 认识 工程 
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WES A X, 我 们 对 双向 列 联 表 ， 即 表 SIA9.2b, SIA9.2e 和 SIA9.2d 进行 独立 性 卡 方 检验 . 
图 SIA9. 2b, SIA9. 2c 和 SIA9. 2d 的 SPSS 输出 给 出 了 检验 结果 , 检验 的 p 值 (着 重 显示 ) 分别 为 
0.023, 0.350 和 0.073. 如 果 我 们 在 a = 0. 01 进行 每 个 检验 , 对 于 每 种 情况 我 们 都 不 能 拒绝 独立 性 
原 假设 . 从 而 , 没有 充分 证 据 表明 问题 Qlb 的 4 种 回答 类 型 的 百分比 依赖 于 性 别 、 受 教育 程度 和 认 
识 的 工程 师 人 数 . 这 些 分 析 使 AAES 在 调查 的 最 终 报告 中 认为 “ 对 于 工程 师 的 态度 主要 是 正面 的 , 并 
且 当 考虑 对 工程 师 熟 悉 程 度 、 性 别 和 受 教育 水 平时 差别 并 不 明显 .” 

现在 ， 考虑 对 间 题 “你 使 用 何 种 媒体 资源 获得 关于 工程 和 工程 师 的 信息 ”的 回答 (06). 成 年 人 中 
使 用 因特网 获得 工程 信息 的 百分比 依赖 于 他 们 对 工程 师 的 熟悉 程度 、 性 别 、 受 教育 水 平和 年 龄 吗 ? 为 
了 回答 这 个 问题 ,我们 对 表 SIA9. 3 的 双向 列 联 表 中 的 汇总 数据 进行 独立 性 卡 方 检验 . 图 SIA9. 2a、 
SIA9. 2b、SIA9. 2c 和 SIA9. 2d 分 别 给 出 了 列 联 表 分 析 的 SPSS 输出 , 注意 所 有 检验 的 p 值 =0. 000. 于 是 ， 
美国 成 年 人 中 使 用 因特网 获得 工程 信息 的 比例 显然 依赖 于 他 们 对 工程 师 的 熟悉 程度 、 性 别 、 受 教育 
程度 和 年 龄 . 

表 SIA9. 2 问题 “工程 师 对 创造 有 害 于 社会 的 事物 负 有 责任 ” 回答 汇总 (每 种 类 型 回答 个 数 ) 
a 全 部 (n=965 名 受 访 者 ) 


完全 同意 部 分 同意 部 分 反对 完全 反对 
99 212 .311 343 








b， 按 对 工程 师 熟 悉 程 度 分 类 ( n 2998 名 受 访 者 ) 




















不 认识 工程 师 至 少 认识 1 个 工程 师 
完全 /部 分 同意 78 231 
不 同意 130 559 
c， 按 性 别 分 类 (n=1 000 名 受 访 者 ) 
男性 女性 
完全 /部 分 同意 143 168 
不 同意 295 394 
d， 按 受 教育 水 平分 类 (n =997 名 受 访 者 ) 
高 中 或 以 下 大 专 本 科 研究 生 
完全 /部 分 同意 100 100 49 59 
不 同意 185 210 153 141 


资料 来 源 : 美国 工程 师 学 会 联合 会 .“ American Perspectives on Engineers and Engineering: Final Report. "Feb. 13, 2004(20 和 22 页 ). 


R SIA9. 3 ”问题 “你 使 用 何 种 媒体 资源 获得 关于 工程 和 工程 师 的 信息 ?” 回 答 汇总 ( 每 种 类 型 回答 个 数 ) 
a_ 按 认识 的 工程 师 人 数 分 类 (m= 871 名 受 访 者 ) 

















认识 0 个 工程 师 至 少 认识 1 个 工程 师 
来 自 因 特 网 5 123 
不 是 来 自 因 特 网 153 590 
b. 按 性 别 分 类 (n =873 名 受 访 者 ) 

男性 女性 
来 自 因特网 77 44 
不 是 来 自 因特网 310 442 

c， 按 受 教育 水 平分 类 (n=850 名 受 访 者 ) 

低 于 本 科 本 科 及 以 上 

来 自 因特网 53 80 


不 是 来 自 因特网 452 265 
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( 续 ) 
按 年 龄 分 类 (n=849 名 受 访 者 ) 
18 ~29 岁 30 ~44 岁 45 ~59 岁 60 岁 及 以 上 
来 自 因特网 33 55 23 11 
不 是 来 自 因 特 网 121 190 221 195 


资料 来 源 : 美国 工程 师 学 会 联合 会 


Response 


Cumulative 
Tu Percent Valid Percent Percent 










Agree Strongly 
Agree Somewhat 
Disagree Somewhat 
Disagree Strongly 
Total 









Response 


Observed N | Expected N 


Agree Strongly 
Agree Somewhat 
Disagree Somewhat 
Disagree Strongly 
Total 


Test Statistics 


[LL [ Response 


Chi- Squarea 150.503 
df 3 
Asymp. Sig. Ü 00 


a. D cells (.096) have expected frequencies less than 
5. The minimum expected cell frequency is 241.3. 


访 者 ) 















a) 全 部 (n=965 名 受 


Q1bResponse * KnowEng Crosstabulation 


PSA: GNE 
Know ü least 1 Total 

231 309 
is 558 688 


208 789 997 


Chi-Square Tests 
Exact Sig. | Exact Sig. 
2-Sided 1-sided 


Count 





Q1ibResponse 





Agree 
Do not agree 













Total 














Asymp. Sig 
2-sided 









Pearson Chi-Square 
Continuity Correctiora 
Likelihood Ratio 
Fisher's Exact Test 
Linear-by-Linear 
Association 

N of Valid Cases 
a. Computed only for a 2x2 table 
b. 0 celis (.096) have expected count less than 9$. The minimum expected count is 64.47- 
c. The standardized statistic is 2.280 


b) 按 认识 的 工程 师 人 数 分 类 (nm = 997 名 受 访 者 ) 











Point 
Probabili 








- " American Perspectives on Engineers and Engineering; Final Report. "Feb. 13, 2004(57 和 58 


图 SIA9. 1 表 SIA9.2“ 工 程 师 对 创造 有 害 于 社会 的 事物 负 有 责任 ” 的 SPSS 分 析 结 果 


页 ). 
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Q1bResponse * Gender Crosstabulation 


Total 


143 168 311 
295 394 689 
438 562 1000 


Count 




















Q1bResponse Agree 


Do not agree 








Total 










Chi-Square Tests 












Exact Sig. 
2-sided 


Exact Sig. 
1-sided 





Point 
Probabili 





Asymp. Sig. 
2-sided 


8358 






Paarson Chi-Square 
Continuity Correctiore 
Likelihood Ratio 
Fisher's Exact Test 
Linear-by-Linear 
Association 

N of Valid Cases 
a. Computed only for a 2x2 table 
D. 0 cells (.0%) have expected count less than 5. The minimum expected count is 136.22. 
C. The standardized statistic is 0.933. 


e) 按 性 别 分 类 (n=1 000 名 受 访 者 ) 























QtbResponse Education Crosstabulation 


Count 


College grad 
49 58 


QibResponse Agree 100 100 
Do not agree 185 210 153 141 
Total 285 310 202 200 


Chi-Square Tests 
Exact Sig. | Exact Sig. Point 
2-sided 1-sided Probabili 
Association 


Asymp. Sig. 
2-sided 
Lad 0.073 
. 0.028 0.004 
N of valid Cases 


a. D cells (.0%) have expected count less than 5. The minimum expected count is 61.79. 
b. The standardized statistic is 1.943. 












Pearson Chi-Square 
Likelihood Ratio 
Fisher's Exact Test 
Linear-by-Linear 




















d) 按 受 教育 程度 分 类 (nn = 997 名 受 访 者 ) 
图 SIA9.1 ( 续 ) 


在 最 终 报告 中 ， AAES 认为 “男性 、 受 教育 程度 较 高 的 年 轻 以 及 对 工程 师 熟 悉 的 人 更 可 能 将 因 特 
网 作为 他 们 获得 工程 消息 的 途径 ”. 可 以 通过 图 SIA9. 2, SPSS 输出 列 联 表 的 列 百分比 验证 这 一 点 . 从 
图 SIA9. 2a 可 以 看 出 ， 至 少 认 识 一 个 工程 师 的 被 抽样 成 年 人 中 17. 3% 使 用 因特网 , 而 不 认识 任何 工 
程 师 的 成 年 人 中 3. 2% 使 用 因特网 . 类 似 地 (从 图 SIA9. 2b) , 19. 9% 的 男性 使 用 因特网 , 而 女性 比例 
为 9.1% ; (从 图 SIA9. 2c)23.2% 的 大 学 毕业 人 群 中 使 用 因特网 , 而 没有 大 学 学 历 的 人 群 为 10. 5% ; 
(从 图 SIA9. 24)21% ~ 22% 的 年 轻 人 使 用 因特网 ， 而 老年 人 比例 为 5% ~99% . 
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3* 


d 





O6Response ' KnowEng Crosstabulation 


| Knoweng — | 
n la 
Know 0 least 1 
Q6Response Use internet Count 5 123 
% within KnowEng 
Do not use Count 590 


% within KnowEng 
Total Count 
% within KnowEng 






























Asymp. Sig. | Exact Sig. 


Exact Sig. 
1-sided 
N of Valid Cases 


2-sided 2-sided 
0.000 
a. Camputed only for a 2x2 table 


b. Ü cells (.096) have expected count less than 5. The minimum expected count is 
23.22. 













Pearson Chi-Square 
Continuity Carrectiore 
Likelihood Ratio 
Fisher's Exact Test 
Linear-by-Linear 
Association 
















a) 按 认识 的 工程 师 人 数 分 类 (nm = 871 名 受 访 者 ) 


OQ6Response ' Gender Crosstabulation 


Gender 
Male Female Total 
QeResponse Use internet Count 77 44 121 
36 within Gender 13.996 


Do not use Count 310 442 752 
% within Gender 80.196 90.9% 86.1% 


Total Count |. 887 486 873 
% within Gender 100.096 100.096 100.096 
Chi-Square Tests 
Exact Sig. 
1-sided 
N of valid Cases 


0.000 
a. Computed only for a 2x2 table 


b. Ü cells (.0%) have expected count less than 5. The minimum expected count is 
93.84. 








































Pearson Chi-Square 
Continuity Correctiore 
Likelihood Ratio 
Fisher's Exact Test 
Linear-by-Linear 
Association 






















b) 按 性 别 分 类 (n=873 名 受 访 者 ) 
图 SIA9.2 Æ SIA9. 3“ 你 使 用 何 种 媒体 资源 获得 关于 工程 
和 工程 师 的 信息 ?” 的 SPSS 分 析 结果 


> 


分 析 





Q6Response ' Education Crosstabulation 


Education 


Less than College grad 
college grad or higher 


Q6Response Use Internet Count 
% within Education 

Do not use Count 
% within Education 

Count 
% within Education 

















Chi-Square Tests 










Pearson Chi-Square 
Continuity Correctiore 
Likelihood Ratio 
Fisher's Exact Test 
Linear-by-Linear 
Association 


Exact Sig. 
1-sided 
N of Valid Cases 


0.000 0.000 
a. Computed only for a 2x2 table 


b. 0 celis (.D0%) have expected count less than 5. The minimum expected count is 
$3.98. 








c) 按 受 教育 程度 分 类 (n=870 名 受 访 者 ) 


QëResponse ' Age Crosstabulation 






= | aa 






Q6Response Count 
% within Age 
Do not use Count 

% within Age 
Total Count 
% within Age 


Use Internet 























Chi-Square Tests 


Asymp. Sig. 
2-sided 


Likelihood Ratio 
Linear-by-Linear 
Association 

N of Valid Cases 


a. 0 cells (.096) have expected count less than 5. The 
minimum expected count is 22.13. 





d) 按 年 龄 分 类 (n=849 名 受 访 者 ) 
图 SIA9.2 (2) 


第 10 章 简单 线性 回归 


目标 ”介绍 基于 响应 y 和 单个 预测 变量 x 之 间 简 单线 性 关系 的 回归 分 析 的 基本 概念 
10.1 回归 模型 


统计 学 最 重要 的 应 用 之 一 是 根据 一 组 有 联系 的 自 变 量 x1 uxo ,… ,x 的 认识 , 估计 响应 变量 y 的 
均值 或 者 预测 y 的 某 个 未 来 值 . 

例如 , 使 用 自动 运输 工具 的 仓库 经 理 可 能 想 建立 堵塞 时 间 y ( 因 变 量 ) 与 有 效 的 运输 工具 数量 和 
正在 搬运 的 装载 物 尺 寸 之 类 变量 ( 自 变量 ) 的 关系 . 目的 是 提出 一 个 把 y 表示 成 自 变量 函数 的 预测 方 
程 (或 模型 ), 这 样 经 理 可 以 对 自 变量 的 特殊 值 预测 y, 并且 最 终 利用 从 预测 方程 研究 获得 的 知识 建 
立 使 堵塞 时 间 最 小 的 策略 . 

另 一 个 例子 , 一 个 工程 师 可 能 想 建 立 机 械 装 配 线 故障 率 y 与 诸如 它 的 运行 速度 和 装配 线 操作 员 
这 样 的 变量 间 关 系 . 目的 是 提出 一 个 联系 因 变 量 y 与 自 变量 的 预测 方程 ， 并 利用 预测 方程 对 各 种 运 
行 速度 和 操作 员 组 合 预 测 故 障 率 y 的 值 . 

用 于 联系 因 变量 y 与 自 变 量 x1 ,xs ,…, zm, 的 模型 称 为 回归 模型 或 线性 统计 模型 ， 因 为 对 给 定 的 
3,, 35,77, Xy 值 它们 把 y 的 均值 表示 成 一 组 未 知 参数 的 线性 函数 , 利用 10.3 节 中 介绍 的 步骤 ,由 样 
本 数据 估计 这 些 参 数 . 

本 章 利用 一 个 非常 简单 的 回归 模型 (联系 y 与 单个 自 变 量 * 的 模型 ) 介绍 回归 分 析 概 念 . 我 们 将 
学 习 如 何 利用 最 小 二 乘法 这 个 模型 拟 合 一 组 数据 , 并 详细 检查 从 回归 分 析 可 能 得 到 的 各 种 不 同类 型 
的 推断 . 在 第 11 ~ 12 章 , 将 运用 这 些 知识 来 理解 多 重 回归 分 析 ( 联 系 y 与 两 个 或 多 个 自 变 量 的 问题 ) 
的 理论 和 实际 应 用 . 

定义 10.1 被 预测 (或 被 建 模 ) 的 变量 y 称 为 因 变量 (或 响应 变量 ). 

定义 10.2 用 来 预测 (或 建 模 )y 的 变量 称 为 自 变 量 , 并 用 符号 x ,x, ,x3 等 表示 . 

前 面 几 童 介绍 了 应 用 统计 学 的 基础 知识 . 虽然 以 后 将 要 遇 到 的 许多 统计 量 抽 样 分 布 的 导出 在 数 
学 上 超出 了 本 书 的 范围 ,但 是 所 学 到 的 知识 将 会 有 助 于 理解 它们 是 如 何 导出 的 , 在 许多 例子 中 , 还 可 
以 得 到 这 些 抽样 分 布 的 均值 和 方差 . 

理论 知识 有 用 的 另 一 个 原因 是 , 统计 学 理论 像 物理 学 、 工 程 学 、 经 济 学 等 理论 一 样 , 只 是 一 个 现 
实 的 模型 . 只 有 当 方 法 中 的 假定 完全 满足 时 , 它 才 能 精确 地 解释 现实 . 因为 这 种 情形 很 少 发 生 , 统计 
学 (或 物理 学 、 工程 学 、 经济 学 等 ) 用 于 解决 现实 世界 问题 是 一 种 艺术 . 因此 , 为 了 把 理论 应 用 于 现实 
世界 ,必须 知道 与 假定 的 背离 在 多 大 范围 内 会 影响 得 到 的 统计 推断 , 并 且 必 须 使 模型 和 方法 论 适 合 
实际 问题 的 条 件 . 对 构成 方法 论 理论 的 基本 理解 可 以 帮 你 做 到 这 些 . 


10.2 模型 假定 


为 了 简化 讨论 , 将 规定 如 下 虚构 的 情形 和 数据 集 . 假定 一 种 新 绝缘 材料 的 开发 者 想 确定 2 in JE 
的 材料 样品 受到 不 同 压力 时 产生 的 压缩 量 , 在 不 同 压力 下 测试 5 张 试验 材料 , 表 10.1 给 出 了 x 值 
(10 Ib/in^) 和 产生 的 压缩 量 y(0. 1 in). 称 为 散 点 图 的 数据 图 如 图 10. 1 所 示 . 
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4 — . 
310.1. 绝缘 材料 的 压缩 量 与 压力 
样 本 压力 x 压缩 量 y 3 上 
1 1 1 
2r ° . 
2 2 1 
3 3 2 1- e ° 
4 4 2 l -| | | l x 
5 5 4 0 1 2 3 4 5 


图 10.1 3€ 10. 1 中 数据 的 散 点 图 


假定 认为 y 值 随 着 x 的 增加 以 线性 方式 的 趋势 增加 , 则 在 图 10. 1 中 选择 画 一 条 穿 过 点 的 直线 作 
为 联系 y Ej x 的 模型 . 如 果 图 10. 1 中 所 有 的 点 都 落 在 拟 合 直线 上 , 这 样 一 个 确定 性 模型 (不 允许 预测 
误差 ) 可 能 是 适当 的 . 然而 可 以 看 到 对 表 10. 1 中 的 数据 , 这 种 理想 情形 没有 出 现 , 无 论 怎 样 画 一 条 
直线 通过 图 10. 1 中 的 点 , 至 少 有 一 些 点 实际 上 是 偏离 拟 合 直 线 的 . 

上 述 问题 的 解决 方案 是 建立 一 个 联系 y x 的 概率 模型 一 一 承认 数据 点 关于 直线 的 随机 变化 ， 
概率 模型 的 一 种 类 型 一 一 简单 线性 回归 模型 , 假定 对 给 定 的 x 值 , y 的 均值 可 以 绘 成 一 条 直线 , 并且 
点 偏离 这 条 均值 直线 是 一 个 随机 ( 正 或 负 ) 量 y 
e, Bil 4. 。 

y= Bo +B +、2 
对 给 定 的 x, y 的 均值 ”随机 误差 
其 中 Bo fü B, 是 模型 确定 ( 非 随机 ) 分 量 的 未 知 参数 . 






如 果 假定 点 在 均值 直线 上 下 偏离 , 有 些 离 差 是 正 的 ， i 
有 些 离 差 是 负 的 , HA E(e) -0, Wy 的 均值 为 ， 
E(y) = E(Bo +Bix + e) IE 


=Bo tBix + E(&) 2 Bo * Byx _ 

因此 对 给 定 * 的 值 , y 的 均值 , 用 符号 E(y)© I7 

表示 , 画 成 一 条 y 轴 截 距 等 于 Bo, 斜率 等 于 Bi 的 直 图 10.2 表 10.1 的 数据 散 点 图 和 均值 的 
线 . 图 10.2 给 出 均值 的 假设 直线 EC) = By +Bix. 假设 直线 E(y) =po +B, 








0 
uc 1 2 3 d Nd 





简单 线性 回归 ( 概率 ) 模型 
y =ñ +Bix+ 
其 中 , y = 因 变量 ; x= 自 变量 ; Ely) =b +b 是 确定 性 分 量 (直线 方程 ) ; e = 随机 误差 分 量 ; B, = 直线 的 y 
轴 截 距 ， 即 直线 与 y 轴 的 截取 点 或 交点 ( 见 图 10.2) ; B = 直线 的 斜率 ， 即 zx 每 增加 1 个 单位 ， y 的 确定 性 分 
量 增 加 (或 减少 ) 量 ( 见 图 10.2). 























O 对 给 定 的 x 值 , y 的 均值 应 该 用 符号 EY) 表示 . 但 是 当 模型 包含 多 于 一 个 自 变量 时 ， 这 个 符号 变 得 很 繁琐 . 因 
此 , 简化 记号 , 用 符号 E(y) 代 表 E(YIx). 
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为 了 用 简单 线性 回归 模型 拟 合 一 组 数据 , 必须 求 均 值 直线 Ey) =B Bux 的 未 知 参数 Be RI B, 
估计 量 . 关于 By 和 pi 的 有 效 推断 依赖 于 估计 量 的 抽样 分 布 , 反 过 来 估计 量 的 抽样 分 布 又 依赖 于 随 
机 误差 e 的 概率 分 布 ; 因此 , 必须 先 对 e 做 些 特殊 的 假定 . 这 些 假 定 总 结 如 下 , 它们 对 每 个 统计 回归 
分 析 都 是 基本 的 . 

假定 1 e 概率 分 布 的 均值 为 0. 即 对 自 变量 x 的 每 个 设置 , 对 无 限 长 试验 序列 误差 的 平均 是 0. 
这 个 假定 意 指 对 给 定 * WÉ, y 的 均值 E(y) E: E(y) =Bo +Bix. 

假定 2 HAZE r 的 所 有 设置 ，s 概率 分 布 的 方差 为 常数 . 对 直线 模型 ,这 个 假定 意 指 对 所 有 
BJ x (E, e 的 方差 等 于 一 个 常数 ， 即 o. 

BES c 的 概率 分 布 是 正 态 的 . 

假定 4 任意 两 个 不 同 观测 值 关联 的 误差 是 独立 的 . 即 与 一 个 y 值 关 联 的 误差 不 会 影响 与 其 他 y 
值 关联 的 误差 . 

前 三 个 假定 的 含意 可 以 在 图 10.3 中 看 出 , 图 10.3 描述 x 的 三 个 特殊 值 x ,zy 和 3 的 误差 分 
布 . 注意 到 误差 的 相对 频率 分 布 是 正 态 的 , 均值 为 0, 方差 为 E(y) 
常数 史 ( 所 有 的 分 布 显示 具有 同样 大 小 的 散布 或 变异 性 )， à 正 误差 
图 10. 3 显示 的 直线 是 给 定 % 值 时 y 的 均值 E(y) =B +B, x. 

有 许多 方法 检验 这 些 假 定 的 有 效 性 , 并 且 当 这 些 方 
法 无 效 时 可 以 应 用 补救 方法 , 我 们 将 在 第 11 章 详细 讨论 
这 些 方法 . 在 实际 中 , 对 最 小 二 乘 估计 和 检验 统计 量 ( 将 Pu 
在 后 面 介绍 ) 具有 期 望 从 回归 分 析 获 得 的 可 靠 性 度量 ， fuz 
这 些 假 定 不 必 精 确 地 成 立 , 在 许多 实际 应 用 中 这 些 假定 x x xy 7 
将 会 适当 地 满足 
10.3 估计 Bo 和 8B,: 最 小 二 乘法 


为 了 选择 对 一 个 数据 集 的 “最 佳 拟 合 " 直 线 , 必须 估计 简单 线性 回归 模型 的 未 知 参数 B UB 这 
些 估计 量 可 以 用 极 大 似 然 法 ( 见 7.3 节 ) 得 到 ,但 是 最 简单 二 
的 方法 (直观 上 暖 引 人 的 ) 是 最 小 二 乘法 . 当 10.2 节 的 假 3 
定 满足 时 ,Bo 和 pi 的 极 大 似 然 估计 和 最 小 二 乘 估计 是 相 
等 的 9， 

检查 图 10.4 可 以 看 出 支持 最 小 二 乘法 的 原因 ,图 
10.4 显示 了 画 在 表 10. 1 中 数据 点 的 散 点 图 上 的 一 条 直 
R, 垂 线 段 代表 点 到 直线 的 离 差 . 滑动 围绕 图 形 的 尺子 可 
以 看 到 可 能 找到 许多 直线 使 离 差 (或 误差) 的 和 等 于 0, 但 
是 可 以 证 明 有 且 仅 有 一 条 直线 使 离 差 平方 和 最 小 . REESE 
方 和 称 为 误差 平方 和 , 用 符号 SSE 表示 ,直线 称 为 最 小 二 
乘 直线 、 回 归 直 线 或 最 小 二 乘 预测 方程 . 


E(y) = Bo + BIx 











图 10. 3 e 的 概率 分 布 











-1rT 


图 10.4 显示 点 关于 直线 离 差 的 图 





O 即使 当 10. 2 节 中 一 条 或 多 条 假设 背离 时 ,最 小 二 乘 估计 也 是 一 种 有 效 估计 方法 . 如 果 假 定 不 满足 ， 从 估计 值 导出 
的 推论 有 效 性 是 可 疑 的 . 
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3 TESI HORN RR, 假定 有 一 个 对 数据 点 的 样本 , 这 些 数据 点 可 以 由 相应 的 
x 和 y 值 识别 ,比如 (%1 yi), (ya? n. (Enya). 例如 表 10.1 中 给 出 的 n=5 个 数据 点 是 (1,1)， 
(2,1), (3,2), (4,2)80(5,4). 响应 VER y 关于 yx 的 直线 模型 是 ， 
y7Bo *tBix te 
均值 直线 是 Ely) =po * By x, 希望 找到 的 拟 合 直线 表示 为 ?= +Bix. 因此 , 7 是 y 的 均值 ECy) BU 
一 个 估计 , 也 是 y 未 来 值 的 一 个 预测 量 ; Bo RIS, 分 别 是 Bo。 和 pi 的 估计 量 . 
对 一 个 给 定 的 数据 点 (如 点 (x;, y;)), y 的 观测 值 是 y;, y 的 预测 值 可 以 通过 把 x; 代入 预测 
方程 ; 
Yi - f t yx; 
得 到 , 第 ;个 y 值 与 它 的 预测 值 的 离 差 为 ; 
Gi -3) =y- (Bo +Bix;) ] 
对 所 有 n 个 数据 点 , y 值 与 它们 预测 值 的 离 差 平方 和 为 ， 


SSE = y [x; - (Bo + Bixi) ]2 


使 SSE 最 小 的 量 B。 和 B61 ， 称 为 总 体 参数 Bo。 和 的 最 小 二 乘 估计 值 , 预测 方程 y = bo + Bux 称 为 最 小 
二 乘 直线 , 

定义 10.3 ”最 小 二 乘 直线 是 具有 比 其 他 任何 直线 模型 更 小 的 SSE 的 直线 . 

使 


SSE = IE - (Bo + Bixi) ? 


取 最 小 值 的 Bo。 和 Bi 可 以 通过 令 两 个 偏 导数 OSSE/0 É, 和 0SSE/2 B, 等 于 0， 并 解 所 得 的 最 小 二 乘 方 
程 的 线性 联 立 方程 组 得 到 . 为 了 说 明 , 首先 计算 偏 导数 ， 


9SSE - 2 - (Bo * ix) ]C- 1) 
à bo 


aSSE 


0f 
令 这 两 个 偏 导数 等 于 0 并 化 简 , 我 们 得 到 最 小 二 乘 方程 ; 


2i- à Po -Êi Da: = Èri -np -BD =0 
Xi B Xx - B 4 = 0 


= = B20 - (Bo + Bixi)] ( = x) 


^ ^ n n 
n Bo MIDI - 2n 
£ £ 


Bo Xx * fi x - iun 
KT bo 和 BI 的 线性 联 立 方程 组 ， 得 到 下 面 框 格 中 的 公式 (证 明 略 ). 
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最 小 二 乘 估计 公式 
^ SS 
斜率 : B. =s 
了 AGE: B = 了 -Bi 
其 中 
n n ( Y x) Y») 
SS, - > (x, - x) Cy, -y)- » -——— 
n n ( Xx.) 
SS. = D (n =a)? = X4 
n= 样本 大 小 . 
RI a XIX 10. 1 中 数据 计算 bo B, 的 最 小 二 乘 估计 ， 然后 计算 SSE. 
b. 给 出 结果 的 实际 解释 . 
解 
a. 求 表 10.2 中 绝缘 材料 压缩 量 数据 的 最 小 二 乘 直线 的 初步 计算 . 现在 计算 
表 10.2 绝缘 材料 压缩 量 例子 的 初步 计算 
x Yi x xiy, x 
1 1 1 1 1 
2 1 4 2 1 
3 2 9 6 4 
4 2 16 8 4 
5 4 25 20 16 
求 和 Xs, -15 Xy, =10 Exi =55 Ery =37 Exi =26 





Ssg = Bayi DRN 37 UNUO -37 -30-7 
2 
Ss, = Za? CD 255 - I9! =55 -45 =10 
则 最 小 二 乘 直线 的 斜率 为 ; 
a SS 7 
Âi == =0.7 


Hy REN: 


Bo =y -iz = En - f, Ch) x - (o7) 032.5. (0.7)(3) =2-2.1 = -0.1 








O ”因为 从 现在 开始 将 会 广泛 地 应 用 求 和 . 当 求 和 包含 样本 中 所 有 测量 时 ， 将 省 略 工 的 范围 , 例如 ， 当 符号 是 y 时 ， 
lic. 
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因此 最 小 二 乘 直线 为 ; 
y=Bo *Bix = -0.1+07x 
这 条 直线 的 图 形 在 图 10. 5 中 给 出 . 
表 10. 1 中 数据 y 的 观测 值 和 预测 值 ，y 值 关于 它们 预测 值 的 离 差 及 离 差 平方 和 在 表 10.3 中 给 
出 . 注意 离 差 平方 和 SSE 为 1. 10. 这 比拟 合 这 组 数据 的 任何 其 他 直线 得 到 的 SSE 值 都 小 . 


表 10.3 ”最 小 二 乘 模型 的 观测 值 和 预测 值 的 比较 

















aL x y Y=-01+07  (y-9) (y-)2 
$=—0.1+0.7x 1 1 0.6 (1-0.6) 20.4 0. 16 
2 2 1 1.3 (1-1.3) = -0.3 0.09 
3 2 2.0 (2-2.0) 20 0. 00 
! 4 2 2.7 (2-2.7) = -0.7 0.49 
0 1 x 5 4 3.4 (4 -3.4) =0.6 0. 36 
误差 总 和 = 0 SSE =1. 10 





图 10.5 直线 y= -0.1+.0.7x 拟 合 数据 


注 : 为 获得 简单 线性 回归 中 的 Bo ， Bi fe SSE 所 要 求 的 计算 , 虽然 直接 ， 但 可 能 会 相当 兄长 ,即使 
利用 计算 器 ,过 程 也 相当 费力 且 易 出 错 , 特别 是 样本 容量 较 大 时 . 许多 工程 师 和 科学 家 依靠 统计 软 
件 来 运行 简单 线性 回归 . 表 10.1 中 数据 分 析 的 SAS、MINITAB SPSS 和 EXCEL 输出 在 图 10.6a — d 


中 给 出 , bo, BL 和 SSE 在 输出 中 着 重 显示 《注意 这 些 值 和 手 算 的 计算 值 是 精确 地 一 致 . ) 











The REG Procedure 
el: MODEL1 
Dependent Variable: CUMP Y 
Number of Observations Read 5 
Number of Observations Used 5 
finalysis of Variance 
Sun. of Mean 
Source DF Squares Square F Value ProF 
Model 1 4.390000 4.90000 13.36 06.0354 
Error 3 1.10000 0. 36667 
Corrected Total 4 5.00000 
Root MSE 9.60553 R-Square 0.8167 
Dependent Mean 2.00000 fidj R-Sq 0.7556 
Coeff Var 30.27650 
Paraneter Estimates 
Paramotor Standard 
Variable DF Estimate Error t Value Pr > iti 
intercept i 706. 10000 0.535038 -0.16 0.8849 
PRESS X 1 0.70000 0.19149 3.56 0.0354 E 





a) SAS 输出 
图 10.6 例 10.1 的 简单 线性 回归 分 析 的 统计 软件 输出 
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The regression equation is 


COMP Y = - 0.100 + 0.700 PRESS X 
Predictor Coef SE Coef T P 
Constant z0.i1000 0.6351 -0.16 0.885 
PRESS X 70.7000 — 0.1915 3.66 0.035 
S = 0.605530  R-Sq = 81.75 — R-Sq(adj) = 75.65 


Analysis of Variance 


Source DF ss HS F P 
Regression 1 4.9000 4.9000 13.36 0.035 
Residual Error 3 u.1000 0.3667 

Total 4 6.0000 











b) MINITAB 输出 
Model Summary 


Adjusted Std. Error of 
RE R Square | R Square the Estimate 
0.9048 0.817 0.756 D.606 


a. — (Constant), PRESS_X 
ANOVA” 

















Regression 


Residuat 


4.900 m 364 "m 0328 
i 0.367 
Total 


a. Predictors: (Constant), PRESS X 
b. Dependent Variable: COMP. Y 






























Unstandardized Standardized 
Coefficients Coefficients 
Model Std. Error Beta 


1 (Constant) 
PRESS_X 
a. Dependent variable: COMP_Y 







c) SPSS 输出 








|. 0903698114 


RY s 0816866687 
zB Adjusted R Square — 0755555558. —— 
2 Standard Error .0.605530071 — 


Observations 5 
















MS E : Significance F 
49 48: 13. 38363636: 0.035352847 
f + 0.368667; 
8 





tai 











Coefflicienfs _ Standard Error. (Slat | P-value Lower 95% Upper 95% 
,0.4 O B350B5296 -0.15746 0.88488308 -2.12112675 1.9211266 
0.7 0.191485422. 3.655631 0.035352847. 0080607358. 1 .3093926 


d) EXCEL 输出 
图 10.6 (£&) 
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b. WE KC: RAR Ó, =0.7 的 解释 是 讨 力 4 每 增加 个 单位 ， 压缩 量 y 将 增加 0.7 个 单位 . 因 
为 y 以 0. Tio 为 单位 ,而 x 以 101b/in? 为 单位 , 所 以 我 们 的 解释 是 压力 每 增加 10 Ibin? , 压缩 量 将 增 
加 0. 7 in. Æ 10. 6 节 将 对 此 推断 附加 一 个 可 靠 性 度量 . 

最 小 二 乘 截 距 B, = -0. 1 是 当 压力 设 定 为 <=0 lb/in? 时 压缩 量 y 的 估计 值 . 因为 压缩 量 永远 不 
能 是 负 的 , 为 什么 出 现 这 样 一 个 无 意义 的 结果 ? 原因 是 我 们 试图 用 最 小 二 乘 模型 对 在 样本 数据 范围 
之 外 且 不 实际 的 x 值 (x=0) 来 预测 y. (我们 将 在 10.9 节 更 多 地 介绍 样本 数据 范围 之 外 的 预测 一 
称 为 外 推 法 ) 因此 , po 并 不 总 是 有 实际 解释 . 只 有 当 =0 在 样本 值 范围 之 内 , 并 是 实际 值 时 ,Bp， 
才 有 一 个 有 意义 的 解释 

概括 而 言 , 我 们 定义 了 满足 最 小 二 乘 准 则 的 最 优 拟 合 直 线 : 即 误差 平方 和 比 其 他 任何 直线 模型 
都 小 . 这 条 直线 称 为 最 小 二 乘 直 线 , 它 的 方程 称 为 最 小 二 乘 预 测 方程 


(3) 应 用 练习 人 
10.4 & B, 和 局. 直线 方程 (确定 性 的 ) 为 Mu" 
Y-B, +B 10.4 类 星体 的 红 移 . 天 文学 家 称 星系 光谱 的 移动 为 


如 果 直 线 经 过 点 (0, 1), 则 * =0, y =1 一 定 满足 


“ 红 移 ”. SO) 的 红 B 
方程 . 也 就 是 说 ， TE". XE (QSO) 的 移 水 平和 视 星 等 ( 即 按 


i 0 对 数 尺度 的 亮度 ) 之 间 的 关系 已 被 发 现 并 发 表 在 

= Wa » Wx-2. v3 Journal of Astrophysics & Astronomy ( 2003 年 3/6 H). 

EREA, ， 则 =2， -3— o e e Sd, EGG Ihe 

` 3 =B, «B, (2) 归 应 用 于 收集 到 的 超过 6 000 个 证 实 有 红 移 的 类 星 

、 W n. 体 的 样本 数据 . 对 某 星 等 范围 分 析 得 到 如 下 结果 ; 
利用 这 两 个 方程 求解 6 和 局 ， 并 求 经 过 点 (0, 1) y=18.13 +6.21x, 其 中 yy = 视 星 等 , x = 红 移 水 平 . 


和 (2, 3) 的 直线 方程 画 出 最 小 一 
a. 出 ` fh yi 
10.2 求 直线 方程 . 找 出 下 列 每 种 情形 中 经 过 点 的 直 用 本 问题 证 mc D ERAT 
APPA 条 直线 c. 用 本 问题 的 语言 解释 斜率 的 估计 值 . 
è 0 2 0) 10.5 土壤 中 的 砷 . 在 美国 科罗拉多 州 首府 丹佛 , 环 
É RI o 境 学 家 发 现 土壤 中 的 高 砷 量 与 1950 至 1960 年 代 使 
1 o aa. , 7) . 用 的 一 种 除草 剂 之 间 有 联系 . ( Environmental Sci- 
. ， 一 E ence & Technology, 2000 4E 9 H 1 R. 近 的 发 现 
10.3 ”识别 了 截 距 和 针 率 . 面 出 下 列 直线 ,给 出 每 条 Tyas +. F h tB n N, BPA 
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a 土壤 中 金属 水 平 通常 随 着 与 源头 (例如 冶炼 厂 ) 
距离 的 增加 而 减少 , 假设 有 一 直线 模型 联系 金 
属 水 平 y 和 到 工厂 的 距离 x. 基于 此 项 理论 , 你 
认为 直线 斜率 是 正 的 还 是 负 的 ? 

b. 检查 镶 的 散 点 图 ，, 图像 是 否 支 持 a 中 的 理论 ? 

c， 检 查 砷 的 散 点 图 ， 图 像 是 否 支 持 a 中 的 理论 ? 
CÈ: 这 个 发 现 促使 调查 人 员 发 现 高 砷 水 平和 除 
草 剂 使 用 之 间 的 联系 . ) 

10.6 车 辆 堵塞 研究 . 现代 仓库 利用 计算 机 化 和 自动 

化 的 向 导 车 来 搬运 材料 . 因此 , 仓库 的 实际 布置 必 

须 仔 细 设 计 避 免 车 辆 堵塞 并 使 响应 时 间 达 到 最 优 ， 

在 Journal of Engineering for Industry (1993 年 8 月 ) 

上 研究 过 自动 化 仓库 的 最 优 设计 . 采用 的 设计 假定 

车 辆 在 仓库 内 运转 时 彼此 不 阻挡 ， 即 没有 堵塞 . 这 

个 假设 的 有 效 性 通过 模拟 (在 计算 机 上 ) 仓 库 运作 

来 检查 . 在 每 次 模拟 中 ,车辆 数 是 变化 的 , 并 记录 

堵塞 时 间 ( 一 辆 车 阻挡 另 一 辆 的 总 时 间 ), 数据 在 

下 表 给 出 . 研究 者 感 兴趣 的 是 堵塞 时 间 (y) 和 车 辆 

数 (x) 之 间 的 关系 . 








车 辆 数 堵塞 时 间 (min) 

1 0 

2 0 

3 0.02 
4 0.01 
5 0.01 
6 0.01 
7 0.03 
8 0.03 
9 0.02 
10 0.04 
11 0.04 
12 0.04 
13 0.03 
14 0.04 
15 0.05 


资料 来 源 : Pandit, R., and Palekar, U. s. "Response time 
considerations for optimal warehouse layout design. " Journal 
of Engineering for Industry, Transactions of the ASME , Vol. 
115, Aug. 1993, p. 326( 3 2). 


a. 建立 数据 的 散 点 图 . 


10.8 


b 求 联系 车 辆 数 (x) 和 堵塞 时 间 (y) 的 最 小 二 乘 
直线 I 


A 


c. fE a pR EUR RUIN CIAR 
d. 解释 6, 和 8, 的 值 . 





10.7 延长 熔 铝 圭 翅 的 寿命 , TERA EHA E 


的 性 质 研 究 发 表 在 The American Ceramic Society 
Bulletin(2005 年 2 H). 评价 6 种 不 同 的 商用 砖 ， 
熔 铝 卉 塌 的 寿命 依赖 于 砖 衬 的 孔隙 率 (孔隙 率 越 
小 ,寿命 越 长 ), 因此 , 研究 者 测量 了 每 种 样品 
砖 的 表 观 孔隙 率 ,， 以 及 每 种 砖 的 平均 孔径 , 数据 
由 下 表 给 出 . 





Tg 表现 孔隙 率 (%) 平均 孔径 (微米 ) 
A 18.8 12.0 
B 18.3 9.7 
C 16.3 7.3 
D 6.9 5.3 
E 17.1 10.9 
F 20. 4 16.8 


资料 来 源 : Bonadia. P.. 
for aluminum cell linings. ” The American, Ceramic Society Bul- 


litin. Vol. 84, No. 2, Feb. 2005( & 2). 


a. 求 联系 孔隙 率 (y) 与 平均 孔径 (x) 的 最 小 二 乘 
直线 . 

b. 解释 直线 的 y RE. 

c. 解释 直线 的 斜率 . 

d. 预测 具有 10 微米 平均 孔径 的 砖 表 观 孔隙 率 . 

溢出 液体 的 渗 开 速度 . 杜邦 公司 一 位 签约 

工程 师 研究 了 溢出 的 易 挥发 液体 流 经 一 表面 时 

HI 18 JF XE JE ( Chemical Engineering Progress, 

2005 4E 1 H). 假设 50 加 仑 甲醇 洲 到 户外 一 水 

平面 上 , 工程 师 应 用 已 经 获得 的 经 验 公 式 ( 假 

定 为 无 潮流 对 流 状态 ) 计算 经 过 从 0 ~ 60 min 

时 间 段 后 的 溢出 的 质量 (了 b) , 计算 的 质量 值 在 

下 表 中 给 出 . 


et al. “ Aluminosilicate refractories 





时 间 (min) 质量 (Ib) | 时间 (min) ”质量 (1b) 
0 6. 64 6 4.94 
1 6.34 8 4.44 
2 6.04 10 3.98 
4 5.47 12 3.55 
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时 间 (min) ”质量 (lb) | 时 间 (min) 质量 (1b) 时 间 雷达 雨量 计 神经 网 络 
14 3. 15 30 0.98 8:10 1.1 1.2 1.4 
16 2.79 35 0. 60 8:15 1.3 1.3 1.9 
18 2.45 40 0. 34 8:20 1.8 1.4 1.7 
20 2.14 45 0.17 8:25 2.1 1.4 1.5 
22 1. 86 ”50 0.06 8:30 3.2 2.0 2.1 
24 1.60 55 0.02 8:35 2.7 2.1 1.0 
26 1.37 60 0. 00 8:40 2.5 2.5 2.6 
28 1.17 8:45 3.5 2.9 2.6 
资料 来 源 : Barry, J. "Estimating rates of spreading and evap- 8:50 3.9 4.0 4.0 
oration of volatile liquids. " Chemical Engineering Progress. 8:55 3.5 4.9 3.4 
Vol. 101, No. 1. Jan. 2005. 9:00 A. M. 6.5 6.2 6.2 
9:05 7.3 6.6 7.5 
a 建立 数据 的 散 点 图 , y = 计算 的 质量 , x = 时 间 . 9.10 &4 28 23 


b. 求 联 系 质量 (y) 和 时 间 (x) 的 最 小 二 乘 直 线 . 

c. 在 a 中 散 点 图 上 画 出 最 小 二 乘 直 线 . 

d. 解释 B, 和 局 的 值 . 

10.9 估计 降雨 量 的 新 方法 . 降雨 量 的 精确 度量 对 许 

多 水 文学 和 气象 学 工程 是 紧要 的 . 监测 降雨 量 的 两 

种 标准 方法 是 利用 雨量 计 / 气 象 雷 达 , 然而 , 这 两 

种 工具 可 能 受到 人 为 和 环境 干扰 而 被 损害 . 在 Jour- 

nal of Data Science(2004 年 4 月 ) 上 , 研究 者 在 蒙特 

利 尔 气象 站 利用 人 工 神经 网 络 ( 也 就 是 基于 计算 机 

的 数学 模型 ) 估计 降雨 量 , 在 70 min 时 间 内 每 5 分 

钟 利用 3 种 方法 做 一 次 降雨 量 估计 , 数据 (mm) 在 

表 中 列 出 . 

a. 提出 一 个 联系 雨量 计 测 量 值 (y) 与 气象 雷达 雨量 
估计 (x) 的 直线 模型 . 

b， 利 用 最 小 二 乘法 对 RAINFALL 文件 中 的 数据 进 
行 模型 拟 合 . 

c. 在 数据 散 点 图 上 画 出 最 小 二 乘 直线 ,图 中 存在 
两 个 变量 之 间 关 系 的 形象 证 据 吗 ? 这 种 关系 是 
正 的 还 是 负 的 ? 

d. 用 本 问题 的 语言 解释 y 截 距 和 斜率 的 估计 值 . 

e. 现在 考虑 联系 雨量 计 测 量 值 (y) 与 人 工 神经 网 络 
雨量 估计 (x) 的 模型 ， 对 此 模型 重复 a ~d 的 
问题 . 





资料 来 源 : Hessami, M. ，et al. "Selection of an artificial 
neural network model for the post-calibration of weather radar 
rainfall estimation. " Journal of Data Science. Vol. 2, No. 2 ; 


Apr. 2004. (采用 图 2 和 图 4. ) 


10.10 橙汁 的 甜 度 , 生产 厂商 (如 美 汁 源 . 纯 品 


纳 ) 经 常 监测 生产 的 榜 守 质量 , 许多 刺激 性 物质 和 
化 学 成 分 的 结合 制造 出 最 美味 的 橙汁 . 例如 一 个 厂 
商 开发 了 橙汁 “ 甜 度 " 的 定量 指标 (指标 越 高 , ET 
RAN, 甜 度 指标 与 像 橙汁 中 水 溶性 果 胶 量 ( 百 万 
分 之 一 ) 的 化 学 测量 之 间 有 联系 吗 ? 对 梅 计 制造 厂 
生产 的 24 次 生产 过 程 收集 的 这 两 个 变量 的 数据 在 
下 表 中 给 出 , 假定 生产 商 想 利用 简单 线性 回归 从 果 
胶 量 (x) 来 预测 甜 度 (y). 

a 求 这 组 数据 的 最 小 二 乘 直 线 . 

b. 用 本 问题 的 语言 解释 8, 和 B, 的 值 

c 如 果 柱 汁 中 果 胶 量 是 300 ppm, 预测 甜 度 指标 . 








时 间 雷达 雨量 计 神经 网 络 
8:00 A. M. 3.6 0 1.8 
8:05 2.0 1.2 1.8 





过 程 甜 度 指标 ARE BE ppm) 
1 5.2 220 
2 5.5 227 
3 6.0 259 
4 5.9 210 
5 5.8 224 
6 6.0 215 
7 5.8 231 
8 5.6 268 
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( 续 ) ( 续 ) 

过 程 甜 度 指标 果 胶 量 (ppm) 羡 岩 的 起 始 深度 x(f) — 玄 岩 5 在 所 需 时 间 y(min) 

9 5.6 239 300 8.91 

10 5.9 212 325 8.54 

li 5.4 410 ` 350 11.79 

12 5.6 256 375 12. 12 

13 5.8 306 395 11. 02 

14 5.5 259 资料 来 源 :; Penner, R. , and Watts, D. G. ^ Mining informa- 
15 ^ 5.3 284 tion. " The American Statistician. Vol. 45, No. 1. Feb. 1991, 
16 5.3 383 p. 6( 1). 

u ui 7l a. 建立 数据 的 散 点 图 . 

ñ *5 264 b， 求 最 小 二 乘 预 测 方程 

19 57 227 “在 散 点 图 上 画 出 最 小 二 乘 直线 ， 

20 5.3 263 d. 解释 n 和 局 的 值 . 

21 59 m 10.12 钢管 的 热 性 能 . 进行 一 项 研究 为 应 用 在 制冷 
2 5.8 220 加 工业 中 的 整体 散热 管 的 热 性 能 建立 模型 (Journal 
23 5.8 246 of Heat Transfer, 1990 4E 8 月 ). 在 试验 中 用 24 种 特 
24 5.9 241 


Ea 表 中 的 数据 是 可 信 的 . 由 于 机 密 性 原因 , 不 能 透露 
生产 厂商 . 

10. 11 ERIRE. 岩石 液压 销 孔 的 两 种 方案 是 
干 式 凿 岩 和 湿式 羡 岩 . ETHE, 压缩 气体 推动 钻 
杆 向 下 ,冲刷 钻 导 并 推动 杆 钴 ; 在 湿 洞 里 ,水 推动 
向 下 . 进行 一 项 试验 确定 随 深度 < 增加 , 在 岩石 上 
TREA S fe ERE SERE EU I IS] y ( The American 
Statistician, 1991 年 2 H), 试验 的 一 部 分 结果 在 下 
表 给 出 . 





当 岩 的 起 始 深度 x(f) — MONS f R] y(min) 

0 4.90 
25 7.41 
50 6.19 
75 5.57 
100 5.17 
125 6. 89 
150 7.05 
175 7.1 
200 6. 19 
225 8.28 
250 4. 84 


275 8. 29 


别 制造 的 矩形 铜 制 整 体 散热 管 , 放出 的 蒸汽 向 下 进 
人 每 一 根 管子 , 测量 蒸汽 侧 热 传递 系数 (基于 管子 
外 表面 积 ). 研究 的 因 变 量 是 热 传 递 提高 率 y, 定义 
为 散热 管 的 蒸汽 侧 系 数 与 在 相同 温度 下 光滑 管 燕 
汽 侧 系数 之 比 . 理论 上 , 热 传 递 与 管子 上 部 由 于 燕 
汽 的 冷凝 作用 没有 蒸汽 涌 人 的 面积 有 关 , 表 中 数据 
是 24 根 整体 散热 管 的 未 涌 人 面积 比 (x) 和 热 传 递 
提高 量 (y). 

a 求 联系 热 传 递 提高 量 y 与 未 涌 人 面积 比 x 的 最 

小 二 乘 直线 . 
b， 画 出 数据 点 和 最 小 二 乘 直线 , 检查 你 的 计算 . 


c. 解释 8, 和 B, 的 值 . 





未 涌 人 面积 比 x 热 传 递 提高 量 y 
1.93 ` 4.4 
1.95 5.3 
1.78 4.5 
1.64 4.5 
1.54 3.7 
1.32 2.8 
2.12 6.1 
1.88 4.9 
1.70 4.9 
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简单 线性 回归 
(E) 
RRAHIM x 热 传 递 提高 量 7 
1. 58 4.1 
2.47 7.0 
2.37 6.7 
2. 00 5.2 
1.77 4.7 
1.62 4.2 
2.77 6.0 
2.47 5.8 
2.24 5.2 
1.32 3.5 
1.26 3.2 
1.21 2.9 
2.26 5.3 
2.04 5.1 
1. 88 4.6 


资料 来 源 : Marto, P. J. ; 
R-113 film condensation on horizontal inregralfin tubes. " Jour- 
nal of Heat Transfer, Vol. 112, Aug. 1990, p. 763( 3€ 2). 


10.13 砖 石 建筑 接 颖 的 强度 . 土木 工程 师 经 常用 直 
线 方程 E(y) = B, + Bos 作为 砖 石 建筑 接 锋 的 平均 
抗 剪 强度 E( y) 和 预 压缩 压力 x 之 间 的 关系 模型 . 
为 了 检测 这 个 理论 ， 对 用 灰 浆 粘 合 的 三 块 一 组 砖 进 
行 了 一 系列 压力 测试 ( Proceedings of the Institute of 
Civil Engineers, 1990 年 3 月 ). 每 3 块 一 组 的 预 压缩 
压力 是 变化 的 ， 并 记录 在 失效 前 的 最 终 剪 切 负荷 
( 称 为 剪 切 强度 ) , 7 组 的 压力 (N/mm ) 结 果 在 下 表 
中 给 出 . 

a. 作 7 个 数据 点 的 散 点 图 , 剪 切 强度 和 预 压缩 压 
力 之 间 是 否 呈 现 线性 关系 ? 

b. 用 最 小 二 乘法 估计 直线 模型 中 的 参数 . 

c. 解释 6, 和 PB, 的 什 


et. al. “ An experimental study of 


10.4 最 小 二 乘 估计 的 性 质 


检查 最 小 二 乘 估 计 公 式 可 以 看 出 它们 是 y XR y, y, + 
(10.2 35) 与 这 些 y 值 关联 的 随机 误差 el ，s，，… 





三 块 一 组 
的 试验 


剪 切 
1.00 2.18 2.24 2.41 2.59 2.82 3.06 
强度 y 


1 2 3 4 5 6 7 


预 压缩 

压力 x 
资料 来 源 : Riddington, J. R., and Ghazali, M. Z. “Hypothesis 
for shear failure in masonry joints. ” Proceedings of the Institute of 
Civil Engineers, Part 2, Mar. 1990. Vol. 89, p. 96( 817). 


10.14 风 轮 机 叶片 压力 . 纽卡斯尔 大 学 (澳大利亚 ) 
的 机 械 工 程 师 研究 了 木材 在 高 效率 小 型 风 轮 机 叶 
片 中 的 应 用 ( Wind Engineering , 2004 年 1 H), 对 两 
种 木材 (放射 杉 和 鳞 叶 南洋 杉 ) 的 强度 进行 了 比较 . 
对 每 种 木材 叶片 的 20 个 样品 ( 称 作 “ 试 样 ”) 进行 疲 
劳 试验 , 在 叶片 旋转 许多 次 后 测量 叶片 压力 
(MPa). 对 每 种 类 型 木材 进行 数据 的 简单 线性 回归 
分 析 得 到 下 面 结果 (其 中 y = 压力 , x = 旋转 次 数 的 
自然 对 数 ). 
放射 杉 : y = 97. 37 -2. 50x 
鳞 叶 南洋 杉 : y = 122. 03 -2. 36x 
a. 解释 每 条 直线 估计 的 斜率 . 

b. 解释 每 条 直线 估计 的 y 截 距 . 
c. 根据 这 些 结果 , 哪 种 木材 类 型 的 叶片 比较 坚固 
且 更 具 耐 疲劳 性 ? 并 加 以 说 明 . 

理论 练习 | 

10.15 ERIA p 的 极 大 似 然 估 计量 为 样本 均 
fÉ y. 考虑 模型 E(y) =u. 证 明 :y 的 最 小 二 乘 估计 
量 也 是 y. (提示 : SSE = Y (y -AY 关于 及 求 极 
小 . ) 

10. 16 


0 0.60 1.20 133 1.43 1.75 1.75 


考虑 线性 联 立 方程: 
n ñ, +B, Xx, = Xy, 
Añ. Ex, +B, XX = Exy, 
Sb fe 3e 88, TB, 的 公式 . 


Ys 的 线性 函数 . 因为 已 经 假定 


， En 是 均值 为 0, 方差 为 o? 的 正 态 分 布 的 独立 随机 


变量 , 因此 y 值 是 均值 为 E(y) = Bo + Bix, 方差 为 P WESA, Ho 和 Bi 具有 正 态 分 布 的 抽样 分 


布 (定理 6.10). 
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Bi 抽样 分 布 的 均值 和 方差 将 在 10. 6 节 给 出 ,在 例 10.2 中 阐述 它们 是 怎样 得 到 的 . 
SRE, 的 抽样 分 布 的 均值 和 方差. 


E BREL 公式 里 的 量 SS,, 只 涉及 % 值 ， 假定 都 是 已 知 的 , 即 非 随 机 的 . 因此 , ERE, 的 期 
望 值 时 SS 可 被 看 作 常 数 . 相反 ,SS,, 是 随机 变量 y. ys, e, y, 的 函数 ， 因此 ， 
SS, = X> (x; - x) (y; -y) = > [ (x; 一 元 ) (y;) 一 (x; —x)y] = > (x, -Xx)yj -yÈ (x; -x) 
但 是 
X> (xw; —x) = Xx; — nx = Èx; ~ bx =0 
因此 , SS, = X (x; 3) y 将 此 式 代入 Bi 的 公式 中 ,可 得 


~ SS 1 (x-7) — (x -zx) (x, - x) 
Lay _ 元) = ~ 
Pi p SS. - SS, > (x 2)» SS, nt SS, » + + SS Ya 








这 说 明 B， 是 正 态 分 布 随机 变量 yi, y, ,…， Yn 的 线性 函数 . 线性 函数 中 的 随机 变量 的 系数 al1，a2 ，…， 
Cn 为 : 
(9 -x) (x) —%) . (x, - x) 


G) = @ = G, = 
SS. 


SS, n SS. 
RB, 抽样 分 布 的 均值 E(B1) 和 方差 V(B,) , 最 后 一 步 是 利用 定理 6 8, 它 给 出 了 求 随机 变量 线性 函 
数 均值 和 方差 的 规则 . 因此 ， 
E(B) =E] n + . ttt A] 
FB yy y, ny, RR 的 相应 值 代入 线性 模型 公式 得 到 的 ， 即 
11=pBo+tPixite! 和 E(y,) =b *Bix, 
Y2 =Bo +Bixı +e, 和 Ely) = 有 Bo *Bix, 

















Yn - Bo *tBix, +e, 和 E(y,) 7 Bo +B x, 

















因此 ， 
ECB) CAS ) + pO) Lus Gn pe 
(x, —x) (x2 一 无) "k 
= S (Bo *Bix1) m (po tix) ++ — (Bo * Bx, ) 
Bo _ Bı _ 
“ss È (z x) *ss E(x 
但 是 ， 


SS, = > (x; -x)? = >l (x; 一 无 ) xi 一 (x; -x)x] = > (x; _ x )x; - x. (x; - x) 
因为 已 经 证 明了 了 (>, — z) =0, 我 们 有 SS, = X(x;-x)x, 因此 ， 


E(B) =0 ta (55. =ñ, 


这 说 明 B, 是 B, 的 无 偏 估 计量 . 
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利用 定理 6.8 给 出 的 公式 求 随机 变量 线性 函数 的 方差 , 并 记 住 任 -- 对 了 值 之 间 的 协 方差 等 于 0， 
因为 所 有 对 y 值 都 假定 为 独立 的 , 我们 有 

















2. 0-3) (x, - x)? oou 08 72)? 
ME 7 (ss, yr 0n) (sg jr on) + + (Se or O) 
根据 第 10. 2 节 的 假定 Km ) 2V(y,) == 2 V(y,) =o2. 因此 
gya I p A g Ha)? 2 PE)? y Sa 0 
PED = (88) tes * t SS 32 = (S5,)? ^ (SS. SS. 
XH 
ga = 7 
B. SS. 


E 10. 6 节 将 利用 例 10. 2 的 结论 检验 关于 回归 直线 斜率 B, 的 假设 , 并 构造 它 的 置信 区 间 . 还 将 
解释 这 些 推断 的 实际 含义 . 
(9) 理论 练习 E X (x, - 3) =0. ) 
10.17 证 明 : 10.18 在 例 10.2 中 证 明了 和 斜率 B, 的 最 小 二 乘 估计 


W pl aD B, 是 Bi 的 一 个 无 偏 估计 , BEC) =B,. 利用 练 
&-s-Bs-x [LER 3] 10. 17 的 结论 证 明 E(B,) -B,. 








(提示 :注意 10.49 在 练习 10.17 中 , 证 明了 可 以 写成 独立 随 
Â, -S= = 2 (s, ocn 机 变量 的 线性 函数 , 利用 定理 6. 8 WEN: 

L2 -a)y yX(w-x) _ X (x, -x)y; Vp -= (2) 

= SS, SS. S, = 


10.5 c “的 估计 量 


大 多 数 实际 情形 中 , 随机 误差 的 方差 o? 是 未 知 的 , 因此 必须 由 样本 数据 估计 . 因为 o? 度量 y 
值 关 于 直线 E(y) 2 Bo +B ix 的 变 差 , 直觉 上 , 用 SSE 除 以 一 个 适当 的 数 来 估计 o7 是 合理 的 . 定理 
10. 1 作为 定理 6. 11 的 一 个 推广 ， 在 得 到 无 偏 估 计量 时 是 有 用 的 . 

定理 10. 1 $s? -SSE/(n-2). WH) 5 10.2 节 假 定 满足 时 , 统计 量 


2 SSE (n-2)$ 
X "E 2 


o 
服从 自 WË v = (n -2) 65 y? 2. 
从 定理 10. 1 得 到 
2X0 
n-2 


则 
E(s? - EQ?) 
AB EQ?) === (n-2). 因此 ， 
E(s*) = T (n -2) = 


n 一 
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可 以 断言 是 o? 的 一 个 无 偏 估计 量 . 
利用 表 10. 3 中 计算 SSE 的 步骤 可 能 导致 大 的 售 人 误差 . 下 面 给 出 了 * 公式 和 计算 SSE 合适 的 
方法 , 我 们 将 在 例 10. 3 阐述 2 的 计算 . 


X 





c? 的 估计 
2 SSE _ SSE 
”误差 的 自由 度数 目 n-2 





其 中 
SSE = X(y, - 3.) -SS,, -BSS,, 
SS, 2 X(y-) = XX -2n 
敬告: 当 执 行 这 些 计算 时 ， 你 可 能 企图 取 整 SS。, B 和 SS。 的 计算 值 . 对 这 些 量 的 每 个 数 一 定 要 取 至 少 
6 位 有 效 数字 以 避免 在 计算 SSE 中 出 现实 质 性 错误 ， 











估计 表 10. 1 中 数据 的 o°. 
解 ”在 绝缘 体 压缩 例子 中 , 已 经 计算 最 小 二 乘 直 线 了 = 0.1 +0.7x 的 SSE =1.10. 回想 有 n=5 
个 数据 点 , 对 估计 o? 有 mn -2 =5 -2=3 个 自由 度 . 因此 ， 
4, SSE 1.10 


是 估计 的 方差 , H 
s = V0.367 =0. 606 
是 = 的 估计 的 标准 差 , 这 两 个 值 在 图 10. 7 中 的 MINITAB 输出 中 是 着 重 显示 的 . 





The regression equation is 


COMP_Y = — 0.100 + 0.700 PRESS_X 

Predictor Coef SE Coef T P 
Constant —0.1000 0.6351 —0.16 0.885 
PRESS X 0.7000 0.1915 3.66 0.035 





g s 0.605830 R-Sq = 81.7%  R-Sq(adj) = 75.6% 


Analysis of Variance 


F ss MS F P 
1 4.9000 4.9000 13.36 0.035 
3 1.1000 93567 

4 


Source D 











E] 10.7 表 10.1 数据 的 MINITAB 简单 线性 回归 
回忆 第 2 章 给 出 的 标准 差 解释 , 并 记 住 最 小 二 乘 直 线 是 对 给 定 的 * 值 估计 y 的 均值 , 可 以 得 到 


的 直观 意义 . 因为 * 度 量 y 值 关 于 最 小 二 乘 直线 的 分 布 的 散布 , 发现 大 多 数 观测 值 位 于 最 小 二 乘 直线 
的 2s =2(0.606) =1.21 范围 内 不 足 为 奇 . 对 这 个 简单 的 例子 ( 仅 有 5 个 数据 点 ) , 所 有 5 个 数据 点 都 
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落 在 最 小 二 乘 直线 的 2s 范围 内 . 在 10.9 45, 当 对 给 定 的 * 值 用 最 小 二 乘 直线 预测 y 值 时 ,将 用 * 评 


估 预 测 的 误差 . 





s 的 解释 ，e 的 估计 的 标准 差 


我 们 期 望 大 多 数 y 的 观测 值 位 于 它们 相应 的 最 小 





应 用 练习 

10.20 解释 标准 差 . 对 下 列 最 小 二 乘 直 线 ， 计 算 

SSE, s? 和 s: 
a. 练习 10. 6. b. 练习 10. 7. 
c. 5&3] 10.8. — d. 练习 10.9. 
e. 5&2) 10.10. £ 练习 10.11. 
g 练习 10.12， h 练习 10.13. 
解释 每 条 直线 的 * 值 . 

10.21 新 炼 铁 工艺 . 一 种 创新 的 炼 铁 技术 ( 称 为 还- 
mk3 ) 可 直接 由 天 然 铁 矿 和 煤 块 生产 高 质量 的 铁 块 . 
Mining Engineering( 2004 年 10 月 ) 发 表 了 新 工艺 生 
产 的 中 间 工 厂 试验 结果 . 作为 研究 的 一 个 阶段 ,中 
间 工 三 试验 生产 的 含 碳 量 与 实验 室 高 炉 试验 的 比 
较 . 25 组 中 间 工 厂 试 验 数据 在 表 中 列 出 . 

a， 作 数据 的 散 点 图 . 

b， 拟 合 简单 线性 模型 联系 中 间 工 厂 试验 中 碳 含量 
y 与 实验 室 高 炉 试验 中 含 碳 量 x, 解释 模型 参数 
的 估计 值 . 

e. 计算 SSE 和 时 . 

d. 计算 s 并 解释 它 的 值 . 














含 碳 量 (% ) 含 碳 量 (% ) 
PII KRZR L 中 间 工 厂 KRZR 
1.7 1.6 3.4 4.3 
3.1 2.4 3.2 3.6 
3.3 2.8 3.3 3.4 
3.6 2.9 3.1 3.3 
3.4 3.0 3.0 3.2 
3.5 3.1 2.9 3.2 
3.8 3.2 2.6 3.4 
3.7 3.2 2.5 3.3 
3.5 3.3 2.6 3.2 
3.4 3.3 2.6 3.1 
3.6 3.4 2.4 3.0 
3.5 3.4 2.6 2.7 
. 3.8 


资料 来 源 Hoffman, G. , and Tsuge, O. "ITmk3—Applica- 
tion of a new ironmaking technology for the iron ore mining in- 
dustry. " Mining Engineering. Vol. 56, No. 9, October 
2004 (图 8). 


二 乘 直线 预测 值 y 的 2s 范围 内 . 








10.22 药品 释放 速度 控制 研究 . Dow 化 学 药品 公司 


的 研究 人 员 研究 了 药片 表面 积 和 体积 对 药品 在 释 
放 剂 量 控制 中 释放 速度 的 作用 . (Drug Development 
and Industrial Pharmacy, Vol. 28, 2002. ) 准备 了 6 
个 形状 相似 具有 不 同 重量 和 厚度 的 药片 , 测量 了 
每 个 药片 表面 积 与 体积 的 比 . 利用 溶解 设备 , 每 个 
药片 放 在 900 mL 去 离子 水 中 , 确定 渗 滤 药品 释放 
速度 (药品 释放 的 百分比 除 以 时 间 平 方 根 ), 试验 
数据 在 下 表 中 列 出 . 





药品 释放 速度 表面 积 与 体积 之 比 
(% 释 放量 / VY 时 间 ) (mm^/mm?) 
60 1. 50 
48 1.05 
39 0. 90 
33 0. 75 
30 0.60 


29 0. 65 
资料 来 源 ， Reynolds, T. , Mitchell, S. ， 和 Balwinski, K. 
“Investigation of the effect of tablet surface area/volume on 
drug release from Hydroxypropylmethylcellulose controlled-re- 
lease matrix tablets. " Drug Development and Industrial Phar- 
macy, Vol. 28, No. 4, 2002( Ë] 3). 


a. 拟 合 简单 线性 模型 ，Ey - B, Bx, 其 中 y 为 药 
品 释放 速度 ,x 为 表面 积 与 体积 的 比 . 

b. 计算 SSE, s^ Jtr s. 

c. 解释 s 的 值 . 


10.23 ”湖泊 中 的 汞 毒化 问题 . 为 响应 关于 缅 因 州 湖 


TREE B) — 0 LAE RH, 环境 保护 局 对 缅 因 州 
120 个 湖 进行 了 实地 研究 . ( Statistical Case Studies; A 
Collaboration Between Academe and Indestry, American 
Statistical Association, 1998. ) 除了 fA HB BS] fe 水 平 
( 百 万 分 之 一 ) ,环境 保护 局 还 测 了 湖 的 海拔 (fi). 
数据 存放 在 MAINLAKE 文件 中 . (前 10 个 湖 的 数据 
在 下 表 中 列 出 . )( 前 10 个 湖 的 数据 显示 ) 





湖 RKE 。 ”海拔 
Allen Pond 1. 080 425 
Alligator Pond .0. 025 1494 
Anasagunticook Lake 0. 570 402 
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( 续 ) a_ 拟 合 简单 线性 模型 ,BE(y) = B, + Bux, 其 中 yy 为 
š FKE 海拔 未 水 平 , x 为 海拔 , 
b. 计算 SSE, š #l s. 
Balch &Stump Ponds 0.770 557 
c. 解释 s 的 值 . 
Baskahegan Lake 0. 790 417 - 
Bauneag Beg Lake 0. 750 205 理论 练习 
Beaver Pond 0. 270 397 、 24 4.4 _ =, bk 
Belden Pond 0. 660 350 10. 24 证 明 :TY(s ) 52o /(n 2). (提示 : 结果 由 
Ben Annis Pond 0. 180 122 定理 10. 1 和 VO) =2 得 到 . ) 
Bottle Lake 1. 050 298 10.25 3E SSE = Y (y, -5,)? -SS - B ss,. 





10.6 评价 模型 的 效用 : 进行 关于 斜率 B1 的 推断 


再 次 考虑 表 10. 1 的 数据 ， 并 假定 绝缘 材料 的 压缩 量 与 压力 是 完全 无 关 的 . 如 果 * 对 y 的 预测 不 
贡献 信息 , 怎样 解释 假设 的 概率 模型 
y-Bo +Bix +e . 
中 po 和 Bi 的 值 ? 它 的 含意 是 y 的 均值 ， 即 模型 E(y) - Bo + Bix 的 确定 性 分 量 ， ANRE x 的 改变 而 
改变 . 不 管 x 取 什么 值 , 总 是 预测 同样 的 yE, 在 直线 模型 中 ， 这 意味 着 真实 斜率 6, 等 于 0. A 
此 , 为 检验 x 对 y 的 预测 不 贡献 信息 的 原 假设 对 这 些 变 量 有 斜率 不 为 0 的 线性 关系 的 备 择 假设 ， 
我 们 检验 
Hy: B, =0 
H : Bj #0 
如 果 数 据 支持 备 择 假 设 , RINE x 确实 对 利用 线性 模型 预测 y 贡献 了 信息 (尽管 E(y) 和 x 之 间 的 
真实 关系 可 能 比 直线 更 复杂 ). 因此 ， 在 一 定 程度 上 ， 这 是 一 个 假设 模型 效用 的 检验 . 
考虑 斜率 Bi 的 最 小 二 乘 估计 量 B, 的 抽样 分 布 可 以 得 到 合适 的 检验 统计 量 . 这 个 统计 量 的 抽样 
分 布 (在 9. 4 节 中 讨论 ) 在 下 面 框 格 给 出 . 


























KB) 
B 的 抽样 分 布 
如 果 确 认 关 于 e 的 4 个 假定 ( 见 10.2 3), 
则 斜率 的 最 小 二 乘 估计 量 后 的 抽样 分 布 是 正 
态 分 布 ， 均 值 为 BEAR) , 标准 误差 为 
of = 一 ~ 一 ( 见 图 10.8) B "^ 
" SS, SS. Las, zos | 
因为 o 通常 未 知 ,所 以 合适 的 统计 量 一 般 . 
是 如 下 形式 的 学 生 了 统计 量 ， F108 B, 的 抽样 分 布 
31 -Bi 的 假设 值 有 -0 
r -Ê 2 A (h sg = s 
Bi sZ / SS. /SS., 


注意 到 用 估计 量 * 代替 o, 然后 用 * BRUSER 9, 这 个 了 统计 量 的 自由 度 和 s 的 自由 度 相 同 , Pi 
想 当 假设 模型 是 直线 时 , 它 将 是 (n -2) 个 自由 度 ( 见 10.5 T. 
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对 模型 效用 的 检验 总 结 在 下 面 的 框 格 中 9. 





模型 效用 检验 : 简单 线性 回归 


单 侧 检验 双 侧 检验 
Ho: B, =0 Hy B =0 
H,: B <0 H,: B >0 


(R# H: p, >0) 


c B Bı 
险 验 统 :7 了 = 一 = 一 一 一 
Ë 计量 JU SA / SS,, 
4E 26,3 - T« -i 3E 26 i. ITI 2442 


(X4 T») 
其 中 t, 和 tun Æ F (n -2) B mu, 可 从 表 B. 7 得 到 . 
假定 : 10.2 节 中 列 出 的 关于 e 的 4 个 假定 . 











参考 例 10. 1 和 例 10.3, 检验 假设 B, =0. 
解 对 绝缘 材料 压缩 量 的 例子 , 选择 a =0.05, 因为 n=5, df = (n-2) =5 -2 =3, 则 双 侧 检 验 
的 拒绝 域 为 : 


T< —toos 或 T > 加 .025 
其 中 加 oz 在 表 B. 7 中 给 出 为 to os =3. 182. 前 面 我 们 计算 B61 =0.7, s =0. 606 和 SS,, =10. 因此 ， 


T- Bi - 0.7 
sZ /SS,, 0. 606/ /10 

因为 这 个 计算 的 + 值 落 在 上 尾 拒绝 域 中 ( 见 图 10.9)， 我 们 拒绝 原 假设 , 并 断言 斜率 B, 不 是 0. 样本 
证 据 表 明 利用 压缩 量 和 压力 之 间 的 线性 模型 ,x 对 y 的 预测 贡献 信息 . 

注 : 可 以 利用 从 计算 机 输出 得 到 检验 的 观测 显著 性 水 平 (p 值 ) 获 得 同样 的 结论 . 简单 线性 回归 
的 SAS 输出 在 图 10. 10 中 重新 给 出 , 检验 统计 量 和 双 侧 p 值 在 输出 中 着 重 显示 . B) 25 p 4Ë = 0. 0354 
比 a =0.05 小 , 我 们 将 拒绝 Ho. 

推断 斜率 B, 的 另 一 种 方法 是 利用 置信 区 间 估 计 ， 这 个 区 间 形 式 如 下 面 显示 . 





=3. 66 





FEL, 的 (1-w)100 匈 置信 区 间 
B tai (E sa = S=) 
并 且 i 基于 (n -2) 个 自由 度 








O 在 简单 线性 回归 中 , 对 po 的 假设 检验 很 少 具有 实际 重要 性 , 为 完整 起 见 ， 检 验 统计 量 是 . 
Bo -Bo 的 假设 什 


s / (1n) + (x)?/S$,, 


已 知 e 的 标准 假定 成 立时 ， 上 式 服 从 自由 度 为 (n” -2) 的 学 生 了 分 布 . 


T= 


368 第 10 章 





求 例 10.1 中 pi 的 95%% 的 置信 区 间 ， 并 解释 结论 . 
解 ” 对 绝缘 材料 压缩 量 的 例子 , 斜率 Bi 的 95% 置信 区 间 是 


A s 0.61 p 
Êi +to.ozs5ĝ, =0.7 +3. i82 (7s) -0.7 =3. 182 人 而] =0.7+0.61=(0.09,1.31) 


xx 


f) 








图 10.9 检验 斜率 B, =0 的 拒绝 域 和 计算 的 : 值 











The HEG Procedure 
Model: MODEL!1 
Dependent Variable: COMP Y 
Number of Observations Read 5 
Number of Observations Used 5 
finalysis of Variance 
Sun of Mean 

Source DF Squares Square F Value Pr > F 

Mode} 1 4.90000 4.90000 13.36 0.0354 

Error 3 1.10000 0.36667 

Corrected Total 4 5.00000 

Root MSE 0.50553 及 -Square 0.8167 
Dependent Mean 2.00000 fidj RH-8q 0.7555 
Coeff Var 30.27650 
Parameter Estimates 
Parameter Standard cape un NM . . 
Variable DF Estimate Error t Value — Pr» [fet 95% Confidence Laits 
intercept 1 -0.10000 0.63509 0.186 0.8849 -2.12112 1.92112 
PRESS X 1 0.70000 0.19148 3.56 0.6354 90.099061 1:30938 
LL _ | 





图 10.10 3 10. 1 中 数据 的 SAS 简单 线性 回归 


(E; 这 个 置信 区 间 在 图 10. 10 的 SAS 输出 中 着 重 显示 . ) 因此 , 我 们 估计 区 间 0.09 ~ 1.31 包含 
斜率 参数 B1. 记 住 y 以 0. 1 in 为 单位 ,x 以 10 Ib/in? 为 单位 记录 , 可 以 说 , 以 95% 的 置信 ， 当 压力 每 
增加 10 Ib/in? 时 , 平均 压缩 量 E(y) 将 增加 0.009 ~0. 131 in 之 间 . 

因为 这 个 区 间 中 所 有 的 值 都 是 正 的 , 这 说 明 0, 是正 的 , 因此 y 的 均值 E Cy) B x 的 增加 而 增加 . 
然而 , 相当 宽 的 置信 区 间 反 映 了 实验 中 数据 点 数 较 少 (从 而 , 也 是 信息 缺乏 ). 如 果 增 加 样本 量 , 我 们 
期 望 一 个 较 窗 的 置信 区 间 ， 

结束 此 小 节 前 , 请 你 注意 在 检验 B, 假设 的 7 统计 量 和 第 8 章 检验 正 态 总 体 均值 假设 的 了 统计 量 
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之 间 的 相似 性 , 同时 也 请 注意 相应 置信 区 间 的 相似 性 . 在 每 种 情形 下 , 检验 统计 量 的 一 般 形式 是 : 


了 


置信 区 间 的 一 般 形 式 是 : 


10-6 


5g 





ĝ + (taro )sg 


其 中 9 是 总 体 参数 9 的 统计 量 , Oo 是 9 的 假设 值 , sç 是 6 的 估计 标准 误 . 
在 本 节 的 选 做 练习 中 , 给 出 了 得 到 检验 Bi 假设 的 了 统计 量 和 构造 B, 的 置信 区 间 的 步骤 . 


应 用 练习 

10.26 KRERET. 参考 练习 10.7, The 
American Ceramic society Bulletin( 2005 年 2 月 ) Efi 
H TRR IR rj BJ ri FEES. 利用 SMELTPOT 文件 
中 的 数据 拟 合 砖 的 表 观 孔隙 率 y( 百 分 比 ) 与 平均 
孔径 x( pm) 之 间 的 直线 模型 . 

a. 求 直线 真实 斜率 的 95% 置信 区 间 , 解释 结论 . 

b. 进行 检验 (a = 0. 05) 确定 直线 的 真实 斜率 是 否 
不 为 0. 

c. 解释 a RI b 的 两 个 推断 给 出 了 直线 模型 效用 的 
相同 信息 . 

10.27 溢出 液体 的 渗 开 速度 . 参考 练习 10. 8 Chemi- 
cal Engineering Progress (2005 年 1 月 ) 关 于 溢出 易 
挥发 液体 在 流 经 表面 渗 开 速度 的 研究 . 利用 LIQ- 
UIDSPILL 文件 中 的 数据 拟 合 溢出 量 y( 了 b) 与 时 间 x 
(min) 之 间 的 直线 模型 . 

a. 求 直 线 真实 斜率 的 90% 置信 区 间 , 解释 结论 . 

b. 进行 检验 (a = 0. 10) 确 定 直 线 的 真实 斜率 是 否 
不 为 0. 

c. 解释 a 和 b 的 两 个 推断 给 出 了 直线 模型 效用 的 
相同 信息 . 

10.28 估计 降雨 量 的 新 方法 . 参考 练习 10.9, Jour- 
nal of Data Science(2004 年 4 月 ) 对 估计 降雨 量 方法 
的 比较 . 考虑 雨量 计量 值 (y) 与 人 工 神经 网 络 雨量 
估计 (x) 之 间 的 简单 线性 回归 . 

a. 检验 y 是 否 与 x 正 相关 , 取 aw =0. 10. 
b. 构造 B, 的 90% 置信 区 间 , 给 出 结论 的 实际 
解释 . 

10.29 HARE. 参考 练习 10. 10 中 橙汁 样本 的 
甜 度 指标 (7) 与 栖 半 中 水 洲 性 果 胶 量 (x) 之 间 的 简 
单线 性 回归 . 求 直线 真实 斜率 的 90% 置信 区 间 . 并 
解释 结论 . 

10.30 钢管 的 热 性 能 . 参考 练习 10.12, Journal of 
Heat Transfer 关于 热 传 递 提高 量 y 与 未 涌 人 面积 比 


x 之 间 直 线 关系 的 研究 . 建立 直线 斜率 B, 的 90% 
置信 和 区间, 解释 结论 . 

10.31 砖 石 建筑 接 颖 的 强度 . 参考 练习 10.13, Pro- 
ceedings of the insititute of Civil Engineers 关于 前 切 强 
EE y 与 预 压力 x 之 间 直 线 关系 的 研究 . 检验 直线 斜 
率 为 正 的 假设 , 取 a =0. 10. 

10.32 种 子 发 芽 率 . 北 卡罗来纳 州 格林 斯 博 罗 大 学 
的 研究 者 研究 种 子 发 芽 率 模型 ( Journal of Experi- 
mental Botany, 1993 年 1 H). 在 一 次 试验 中 , 将 紫 
花 首 藉 种 子 放置 在 特别 建造 的 发 芽 室 中 . 11 个 小 
时 后 , 检查 种 子 并 记录 下 自由 能 量变 化 (发 芽 率 的 
一 种 度量 ) , 种 子 在 7 种 不 同 温度 下 发 芽 结果 在 下 
表 中 给 出 . 用 简单 线性 回归 模型 拟 合 数据 y = B 
由 能 量变 化 , x = 温度 . 





自由 能 量变 化 (KJ/mol) 温度 (K) 
7 295 
6.2 297.5 
9 291 
9.5 289 
8.5 301 
7.8 293 
11.2 286. 5 


资料 来 源 : Hageseth, G. T. , and Cody, A. L. “Energy-level 
model for isothermal seed germination. ” Journal of Experimen- 
tal Botany, Vol. 44, No. 258, Jan. 1993, p. 123( 图 9). 


画 出 散 点 图 . 

. 求 最 小 二 乘 预测 方程 , 

. 在 a 的 散 点 图 中 画 出 b 的 最 小 二 乘 直线 . 

. 进行 模型 适当 性 的 检验 , 取 a =0. 01. 

. 利用 c 中 的 图 , 找 出 任何 不 寻常 的 数据 点 (异常 
值 ). 
f 从 数据 集中 剔除 e 中 的 异常 值 , 重复 a ~ d. 

10.33 森林 片断 研究 . 生态 学 者 把 森林 片断 分 为 人 


° = ° = p> 
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为 ( 即 由 于 像 筑 路 或 伐木 那样 的 人 类 开发 活动 ) 或 
自然 原因 (例如 沼泽 地 或 野火 ). Conservation. Ecolo- 
gy(2003 年 12 月) 发 表 了 一 篇 关于 54 处 南美 森林 
片断 化 原因 的 研究 . 利用 先进 的 高 辨析 卫星 图 , 研 





人 为 片断 指标 和 一 个 自然 片断 指标 . 样本 中 5 处 森 

林 的 这 两 种 指标 值 (其 中 大 的 指标 值 说 明 更 多 的 断 

片 ) 在 下 表 中 给 出 . 54 处 森林 的 数据 存放 在 FOR- 

FRAG 文件 中 . 

a. 生态 学 家 推测 这 两 个 片断 指标 之 间 存 在 近似 线 
性 (直线 ) 关 系 , 画 出 54 处 森林 的 数据 图 , 图形 
支持 这 个 推测 吗 ? 

. 删除 人 为 指标 最 大 的 三 处 森林 数据 ,再 作 a 中 
图 形 , 评论 生态 学 家 的 推测 . 

c. 利用 最 小 二 乘法 对 FORFRAG 数据 文件 子 集 拟 

合 直线 模型 , 给 出 最 小 二 乘 预测 方程 . 

d， 用 本 问题 的 语言 解释 B 和 有 的 估计 . 

.有 足够 的 证 据说 明 自 然 原因 片断 指标 (x) 和 人 为 片 
PERO) 是 正 线性 关系 吗 ? 检验 取 a =0. 05. 

- 求 并 解释 当 自 然 原因 片断 指标 (x) 每 增加 1 个 
点 , 人 为 片断 指标 (y) 变化 的 95% SARRE. 


= 


e 


rn 








(前 5 个 观测 值 列表 ) 
生态 区 域 (森林 ) 人 为 指标 y 自然 指标 x 
Araucaria moist forests 34.09 30. 08 
Atlantic Coast restingas 40. 87 27. 60 
10.7 相关 系数 


在 10.6 节 中 , 我 们 发 现 最 小 二 乘 斜率 p, 





(E) 

生态 区 域 (森林 ) 人 为 指标 y ”自然 指标 x 
Bahia coastal forests 44.75 28.16 
Bahia interior forests 37. 58 27.44 
Bolivian Yungas 12.40 16. 75 


et al. “ Distribution and causes of 


资料 来 源 : Wade, T. G., 
global forest fragmentation. ” 
No. 2, Dec. 2003( 3€ 6). 


理论 练习 
10.34 ”解释 当 10.2 节 4 个 假定 满足 时 , 为 什么 


zB1-B B -B 


OB Oo/ SS. 
服从 均值 为 0、 方差 为 1 的 正 态 分 布 


10.35 “可 以 证 明 (证 明 略 ) 最 小 二 乘 估计 记 和 房 与 


s 独立 (在 概率 意义 上 ). 利用 这 个 事实 , 结合 定理 
10. 1 和 练习 10.34 的 结论 , 证 明 : 


T- 8 B-B 
SS.. 
服从 自 ee 了 分 布 . 
10.36 利用 练习 10.35 中 了 统计 量 作为 枢 轴 统 计量 
SEU B, 的 (1 - a)100% 置信 区 间 . 


Conservation Ecology. Vol. 72, 


提供 了 两 个 随机 变量 y RI x 之 间 线 性 关系 或 “关联 ”的 


有 用 信息 . 另 一 一 种 度量 关联 的 方法 是 计算 皮尔 孙 乘 积 矩 相关 系数 在 下 面 定义 的 相关 系数 , F 


最 小 二 乘 斜率 B, 一 样 ， 提供 了 样本 中 x 和 y 之 间 线性 关系 强度 的 定量 度量 , 但 与 斜率 不 一 样 的 是 相 
关系 数 " 是 无 标 度 的 . r 值 总 是 在 -1 ~1 之 间 , 不 管 x 和 y 的 单位 是 什么 . 
定义 10.4 皮尔 提 飞 积 答 相关 系数 r 是 样本 中 两 个 交 量 x 和 y 之 间 线 性 关系 强度 的 度量 , 它 可 
由 下 式 计算 (对 x do y 的 nn 个 测量 值 的 样本 ); 
SS 


I p /SS,,SS,, 
因为 + 和 Bi 都 提供 关于 模型 效用 的 信息 ， 在 它们 的 计算 公式 中 存在 相似 性 并 不 惊奇 . 特别 地 , 注 
意 到 SS 出 现在 两 个 表达 式 的 分 子 上 , 因为 两 个 分 母 都 是 正 的 , 因此 和 6， 总 是 具有 相同 的 符号 (或 同 


正 或 同 负 ). " 值 接近 或 等 于 0 意 指 * fl y 之 间 具有 小 的 或 没有 线性 关系 ; 相反 , r 值 越 接近 1 或 -1, 表 
3] x 和 y 之 间 线 性 关系 越 强 ; 并 且 如 果 r=1 或 r= -1， 表明 所 有 点 精确 地 落 在 最 小 二 乘 直线 上 . > 到 
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正 值 意 指 y B8 x 的 增加 而 增加 ; 取 负 值 意 指 y BË z 的 增加 而 减 小 , 见 图 10. 11. 











x 
a) 正 的 > :y 随 x 的 增加 而 增加 br 接近 0 :和 x 之 间 有 很 弱 或 没有 线性 关系 
了 
—X 
中) 负 的 + :y 随 x 的 增加 而 减 小 d)r=1 :yy 和 x 之 间 是 完全 正 的 线性 关系 
y 








x Xx 
e)r=-1: y lx 之 间 是 完全 负 的 线性 关系 fr 接近 0 :y 和 x 之 间 有 很 弱 或 没有 线性 关系 


图 10. 11 r 值 和 它们 的 含义 


| 例 10.6 | 例 10. 1 的 数据 重新 在 表 10.4 中 给 出 , 计算 压力 x 和 压缩 量 y 之 间 的 相关 系数 ,, 
解 ”由 前 面 的 计算 ( 见 例 10.1), 我 们 有 SS. =7, SS, = 


表 10.4 绝缘 材料 的 压缩 量 和 压力 
10, Xy, 210 MEy? =26. 则 


压力 x(10 1b/in?) — 压缩 量 7(0. 1 in) 











(Ey)? (10)? 

v2 il - - 
858, = Xyp-—7—-226- 5 =26 -20 =6 1 1 
2 1 
且 相 关系 数 为 ; 3 ; 

SS 

r- = — = 7 = Tg = 0.904 4 2 
J/SS4,SS,  V/(10)(6) 7.7 5 4 





因而 , 压力 和 压缩 量 是 高 度 相关 的 一 一 至 少 对 绝缘 材料 这 5 
组 数据 的 样本 . 这 表示 这 些 变量 之 间 存在 很 强 的 正 线性 关系 . 然而 , 我 们 必须 小 心 , 不 能 匆匆 作出 无 
根据 的 结论 . 例如 ， 新 绝缘 材料 的 设计 者 企图 得 到 增加 压力 总 将 导致 更 大 的 压缩 量 的 结论 ， 这 个 结 
论 的 含义 是 两 个 变量 之 间 存 在 一 种 因果 关系 . 然而 ， 高 度 相关 并 不 药 涵 因果 关系 . 许多 其 他 因子 (如 
湿度 和 湿度 ) 可 能 对 出 现在 样品 中 压缩 量 的 增加 有 贡献 

警告 : 高 度 相 关 并 不 蕴含 因果 关系 ,如 果 观 测 到 样本 相关 系数 7 的 一 个 大 的 正 值 或 负 值 , 就 断定 
% 的 政变 引起 y 的 改变 是 错误 的 , 唯一 有 效 的 结论 是 x 和 yy 之 间 可 能 存在 一 种 线性 趋势 . 
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记 住 相关 系数 度量 样本 中 * 值 和 7y 值 之 间 的 相关 性 ,而 且 在 被 选取 数据 点 的 总 体 中 存在 一 个 
”相似 的 线性 相关 系数 , 总 体 相 关系 数 用 符号 p 表示 . 如 你 期 望 的 , p 由 相应 的 样本 统计 量 来 估计 . 或 
者 , 与 其 说 估计 p, 我 们 可 能 更 想 检验 Ho: p =0 对 H: ps0, 即 检验 * 对 利用 直线 模型 预测 y 不 提供 
信息 的 假设 对 两 个 变量 至 少 是 线性 相关 的 备 择 假设 . 然而 , 在 10.6 节 检验 Ho: B, =0 对 及: B z0 
_ 时 就 已 经 完成 了 相同 的 检验 . 

容易 证 明 r- B, SSS. 因而 Bi =0 意味 着 r=0, 反 过 来 也 一 样 . 因此 原 假设 Hy: p =0 等 
价 于 假设 Ho: B, =0. 当 在 绝缘 材料 压缩 量 例 子 中 检验 原 假设 Ho: B, =0 时 , 对 w =0.05, 数据 拒绝 原 
假设 . 这 意味 着 两 个 变量 (压力 和 压缩 量 ) 之 间 的 零 线性 相关 的 原 假设 在 a =0. 05 时 也 被 拒绝 最 小 
二 乘 斜 率 B, 和 相关 系数 r 之 问 唯一 的 真正 不 同 是 测量 尺度 , 因此 , 它们 提供 的 关于 最 小 一 乘 模型 
效用 的 信息 在 一 定 程度 上 是 重复 的 . 此 外 , 斜率 Bi 给 我 们 x 每 增加 一 个 单位 y 增加 量 的 附加 信息 . 
由 于 这 个 原因 ,推荐 用 斜率 来 推断 两 个 变量 之 间 正 或 负 的 线性 关系 存在 性 . 对 那些 更 喜欢 用 相关 系 
数 -检验 两 个 变量 间 线性 关系 的 人 们 ， 我 们 将 检验 方法 列 在 下 面 框 格 中 . 











线性 相关 的 假设 检验 
单 侧 检验 双 便 检验 
Hy p=0 Hy p=0 
H: p>0 H: p 0 
(或 者 p <0) 
N r /n-2 
检验 统计 量 : T= == 
拒绝 域 : T >t, 拒绝 域 : ITI >t 
(或 者 了 < - t.) 
其 中 如 和 to 是 从 表 B.7 得 到 的 自由 度 为 (n -2) 的 临界 值 
RE: (x, 7) 值 的 样本 是 从 (二 元 ) 正 态 总 体 中 随机 选择 的 @. 








下 面 的 例子 说 明 在 真实 关系 为 非 线 性 情形 时 ,相关 系数 可 能 误导 * 和 y 之 间 关 联 强度 的 
度量 . 

LENA 充气 不 足 或 过 于 膨胀 的 轮胎 可 以 增加 轮胎 腐 扣 并 减少 汽油 行驶 的 里 程 . -种 新 型 轮 
胎 制造 商 在 不 同 压 力 下 测试 的 轮胎 磨损 结果 列 于 表 10.5 中 , 计算 数据 的 相关 系数 ,并 解释 
结论 . 

解 利用 计算 机 而 不 用 手 算 求 > 值 , 图 10. 12 中 给 出 相关 分 析 的 SAS 输出 . 输出 中 阴影 表示 的 / 
值 为 "= -0.114, 这 个 相对 较 小 的 值 描述 了 压力 (x) 和 里 程 (y) 之 间 的 弱 线 性 关系 . 然而 , 制造 商 
断言 轮胎 压力 对 轮胎 磨损 只 有 很 小 或 没有 影响 是 不 负责 任 的 . 相反 , 如 图 10. 13MINITAB 散 点 图 阐明 
压力 和 磨损 之 间 关系 相当 强 , 注意 这 个 关系 不 是 线性 的 ,而 是 曲线 的 ; 充气 不 足 的 轮胎 ( 低压 力 值 ) 
和 过 于 膨胀 的 轮胎 (高 压力 值 ) 都 导致 低 的 行车 里 程 





O NUR x BL y 的 边缘 分 布 都 是 正 态 的 ， 它们 的 联合 概率 分 布 将 是 二 元 正 态 的 ( 这 是 原 书 注 ， 译 者 认为 未 必 如 此 ). 
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表 10.5 #J 10.7 的 数据 


























压力 x( Ib/in? ) 里 程 x T)| 压力 x( lb/in? ) 里 程 y( T) Pearson Correlat jon Coe t fac [akani N = 14 
30 29.5 33 37.6 PRESS X MILEAGE, Y 
PRESS X 1.00000 二 
0.5987 
MILEAGE Y -0.11371 1.00000 
0.6987 








图 10.12 3€ 10.5 数据 的 SAS 相关 性 分 析 


例 10.7 指出 利用 来 确定 x 预测 y 有 多 好 是 危险 的 : 相关 系数 > 仅仅 描述 x A y 之 间 的 线性 关 
系 . 对 于 非 线性 关系 ,7 值 可 能 使 人 误解 , 需要 用 其 他 方法 来 描述 和 检验 这 种 关系 . 对 曲线 关系 的 回 
归 模 型 将 在 第 11 章 介绍 . 


Scatterplot of MILEAGE, Y vs PRESS. X 











30 31 32 33 34 35 36 
PRESS X 


图 10.13. 3€ 10. 5 数据 的 MINITAB 散 点 图 


10.8 决定 系数 


23 —' FE BEBE x 在 预测 y 中 贡献 的 方法 是 利用 % 提供 的 信息 可 以 减少 y 的 多 少 预 测 误差 . 

为 了 说 明 ,假定 样本 数据 散 点 图 如 图 10. 14a 所 示 . 如 果 假 定 x 对 y 的 预测 没有 贡献 , y 值 最 好 的 
顶 测 是 样本 均值 7, 这 表示 为 图 10. 14b 中 的 水 平 直线 . 图 10. 14b 中 的 垂 线段 是 点 关于 均值 了 的 离 
25. 注意 模型 y= 了 的 离 差 平方 和 为 SS, = X (y, -万 )2. 

现在 假定 用 最 小 二 乘 直 线 拟 合同 -- 组 数据 , 并 如 图 10. 14c 所 示 那 样 画 出 点 关于 直线 的 离 差 . 比 
较 图 10. 14b il c 关于 预测 直线 的 离 差 , 你 可 以 看 到 ; 

1. HE x 对 y 的 预测 贡献 很 小 或 没有 贡献 , 则 两 条 直线 的 离 差 平方 和 

SS,=> (y; -»?* 和 SSE-Y (y; - yi) 

几乎 相等 . 

2. 如 果 * XE y 的 预测 确实 贡献 了 信息 , 则 SSE H SS, Jx. 事实 上 , 如 果 所 有 点 都 落 在 最 小 二 乘 直 
线 上 , 则 SSE = 0. 


度量 最 小 二 乘 方程 ?= B +Bix 作为 y 预测 有 多 好 的 -种 简便 方法 是 计算 可 以 归 因 于 y BRE GE 
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方 和 减 小 量 , 并 将 它 表示 为 与 SS， 的 比例 . 这 个 量 称 为 决定 系数 ， 即 














SS, — SSE 
SS, 
在 简单 线性 回归 中 , 可 以 证 明 这 个 量 等 于 简单 线性 相关 系数 r 的 平方 
y 1 $= Êo + Bx 
y 
— y = x 
a) 数据 散 点 图 b) 假定 : x 对 y 的 预测 不 贡献 信息 ; P= BE: x 对 y 的 预测 贡 +h ĝ Bix 


图 10.14 ”两 种 模型 离 差 平方 和 的 比较 
定义 10.5 决定 系数 是 





yy yy 
CRT y 值 关于 它们 的 预测 值 y 的 离 差 平方 和 可 以 归 因 于 y 和 % 之 间 线 性 关系 的 比例 . (在 简单 线性 
回归 中 , 它 也 可 以 作为 相关 系数 7 的 平方 来 计算 . ) 
注意 ” 总 是 在 0 ~1 之 间 , 因为 > 在 -1~1 之 间 . 因此 , r =0.60 意味 着 用 y 代替 了 来 预测 y 时 ， 
y 值 关 于 它们 预测 值 的 离 差 平方 和 减少 了 60%. 或 者 更 实际 地 , r =0. 60 意 指 联系 y 和 x 直线 模型 可 
以 解释 (或 说 明 ) 出 现在 y 值 样本 中 60% 的 变异 ， 


和 凡 庆 :计算 绝缘 材料 压缩 量 例子 的 决定 系数 , 表 10.6 中 重新 给 出 数据 . 
解 首先 计算 ; 340.6 510.8 的 数据 
. 2 
sS, = 4 C9 -26 - (0) =26 -20-6 压力 x (10 Ibin?) 压缩 量 y(0. 1 in) 


5 
由 前 面 计算 , 我 们 有 ! ! 
SSE = E(yj-y,))? 21.10 
则 决定 系数 由 下 式 给 出 : 
SS -SSE 6.0-1.1 4.9 
°= "SS = 6&0 ^&o 0.817 


yy 
注意 : 这 个 值 也 可 以 通过 例 10. 6 中 得 到 的 相关 系数 + =0.904 平方 获得 , 或 直接 从 计算 机 输出 获 
得 , 这 个 值 在 图 10. 15 的 SPSS 输出 中 着 重 显示 . 
Model Summary 
Adjusted Std. Error of 
Dess | o [nsa [iios | Fedina | 
| 0904| 087 
a. — (Constant), PRESS_X ý 
图 10. 15 显示 决定 系数 的 SPSS 输出 
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所 以 知道 由 最 小 二 乘 直线 7》= -0.1+0.7x 利用 压力 * 预测 压缩 量 y, 由 于 利用 线性 预测 量 ?, 使 
5 个 样本 值 y 关于 它们 预测 值 的 离 差 平方 的 总 和 减少 82% , 即 压缩 值 的 样本 变异 的 82% 可 以 由 最 小 
二 乘 直 线 解 释 . 





决定 系数 x? 的 实际 解释 
样本 值 y 关于 它们 均值 了 的 离 差 平方 总 和 的 100 (r^ ) 96 可 以 解释 为 (或 归 因 于 ) 在 直线 模型 中 利用 “来 
预测 y. 











在 直线 回归 模型 认为 是 统计 上 适当 的 y 预测 量 时 , 2 可 以 指导 回归 分 析 员 寻找 更 好 、 更 有 用 的 
模型 . 例如 , 设计 工程 师 利 用 简单 线性 模型 建立 建筑 物 的 机 械 施 工 ( 供 热 、 通风 和 铺设 管道 ) 材 料 的 
费用 与 地 面 面 积 的 关系 . 基于 26 个 工厂 和 仓库 建筑 物 的 数据 , 找到 由 图 10. 16 给 出 的 最 小 二 乘 预测 
方程 . 由 此 推断 地 面 面 积 与 机 械 费 用 之 间 是 线性 关系 ,因为 得 到 的 7 统计 量 ( 为 检验 Ho: Bi =0) 等 
于 3.61, 这 在 a 小 到 0.002 时 是 显著 的 . 因此 ， 当 预 测 一 个 工厂 或 仓库 的 机 械 费 用 时 地 面 面 积 是 有 
用 的 . 然而 , 决定 系数 值 ”为 0.35, 这 告诉 我 们 机 械 费 用 的 变异 性 只 有 35% 是 由 于 地 面 面 积 不 同 引 
起 的 . 这 个 相对 较 小 的 亡 值 引导 工程 师 把 其 他 自 变量 (如 体积 、 玻璃 量 ) 包 含 在 模型 中 , 试图 解释 机 
械 花 费用 变异 中 不 能 由 地 面 面 积 解释 的 剩 下 65% 的 重要 部 分 . 在 下 一 音 ， 讨论 联系 一 个 响应 变量 与 
多 个 自 变量 的 重要 性 . 


y 
s004- 
700 - p? =0.35 
s 1481 
600 - y =43.046+0.593x 
会 
S 
x 
条 
RI 
= 
sa 











地 面 面 积 (km2) 
图 10. 16 把 花费 和 地 面 面 积 联系 起 来 的 简单 线性 模型 


应 用 练习 10.38 ZEN. 人 类 迁移 的 一 个 稳健 并 高 度 采用 


的 模型 是 费 茨 法 则 . 根据 费 茨 法 则 , 迁移 和 选择 位 


10. 37 Rrr. 对 下 列 练习 中 每 组 样本 数据 ， 求 于 距离 (或 长 度 ) 为 4 和 宽度 为 下 处 的 目标 需要 的 


相关 系数 和 决定 系数 , 解释 结论 . 


时 间 了 为 : 
a 练习 10.6， e. 练习 10. 10. T-a +b log, 2A/W) 
b. 49107. £ 4&3 10.11. JP a RUD 是 利用 简单 线性 回归 估计 的 常数 . 量 
c. 练习 10.8. g 练习 10. 12. log, (2A/W) 称 为 难度 指标 (ID ) , 表示 模型 中 的 自 
d. 练习 10.9. h. 练习 10.13. 变量 (以 “位 ”度量 ). 发 表 在 Special Interest Group on 
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Computer-Human Interaction Bulletin( 1993 年 7 月 ) 上 

的 研究 利用 费 茨 法 则 对 在 计算 机 上 执行 某 项 任务 

所 需要 的 时 间 (ms) SEES, 基于 对 n = 160 次 试验 收 
集 的 数据 (用 不 同 的 4 和 多 值 )， 得 到 下 面 的 最 小 

T -175.4 «133. 2(ID) 

a. 解释 估计 值 175.4 和 133. 2. 

b， 此 分 析 的 相关 系数 为 + =0.951, 解释 这 个 值 . 

c. 进行 检验 来 确定 费 茨 法 则 模型 对 预测 执行 时 间 

是 否 统计 上 恰当 , W a =0. 05. 

d 计算 决定 系数 U, 解释 结论 . 
10.39 类 星体 红 移 . 参考 练习 10. 4, Journal of As- 
trophysics & Astronomy( 2003 4 3/6 H ) X RU f ZT 
移 的 研究 . 回忆 利用 简单 线性 回归 对 QS0 的 星 
等 (y) 作 为 红 移 水 平 (x) 的 函数 进行 建 模 . 除了 
最 小 二 乘 直线 y = 18. 13 +6. 21x, 还 确定 相关 系 
数 为 >=0. 84. 
a、 用 本 问题 的 语言 解释 r 值 . 
b. r 和 估计 的 直线 斜率 之 间 是 什么 关系 ? 
c. 求 王 值 并 解释 . 
10.40 风 轮 机 叶片 压力 . 参考 练习 10,14, Wind En- 
gineering (2004 年 1 月 ) 应 用 于 高 效 小 型 风 轮 机 叶 
片 的 两 种 木材 (放射 杉 和 鳞 叶 南洋 杉 ) 的 研究 , #l 
用 简单 线性 回归 对 两 种 木材 的 压力 (y) 和 叶片 旋转 
次 数 自然 对 数 数 据 进行 分 析 . 这 里 再 次 给 出 结果 及 
决定 系数 的 附加 信息 ,解释 每 种 木材 的 1^ 值 . 
放射 杉 : y =97.37 -2. 50x, r =0.84 
鳞 叶 南洋 杉 : 7 = 122.03 -2.36x， r? =0.90 
10. 41 除去 水 中 的 金属 . 在 Electronic Journal of Bio- 
technology(2004 年 4 月 15 R) E, 埃及 科学 家 研究 
了 除去 水 中 重金 属 的 一 种 新 方法 . 制备 在 玻璃 容器 
中 金属 溶液 ， 然后 用 生物 吸收 作用 除去 金属 离子 ， 
对 每 个 测试 容器 测量 两 个 变量 : y = 金属 吸收 (每 
克 生 物 吸 收 的 金属 毫克 ) 及 x = 溶液 中 最 终 的 金属 
浓度 (mg/L). 
a. 号 一 个 联系 y 和 % 的 简单 线性 回归 模型 
b. 对 一 种 金属 , 简单 线性 回归 分 析 得 到 2 =0. 92 ， 

解释 这 个 结果 . 

10.42 在 线 课程 成 绩 . 佛罗里达 州立 大 学 信息 科 
学 家 评价 在 线 课 程 对 学 生成 绩 的 影响 ( Educa- 
tional Technology & Society, 2005 年 1 月 ). 在 线 
高 级 网 络 应 用 课程 24 个 毕业 生 的 样本 中 每 个 学 
生 都 被 问 到 ,“ 你 每 学 期 (平均 ) 有 多 少 在 线 课 


程 ? "同时 记录 每 个 学 生 的 每 周 测验 成 绩 . 信息 

科学 家 发 现在 线 课 程 数 和 每 周 测验 的 评分 是 负 

相关 的 , r= -0.726. 

a. 给 出 7 的 实际 解释 . 

b. 研究 者 推断 在 线 课 程 数 和 每 周 测验 评分 之 间 是 
“显著 的 负 相 关 ”, 你 同意 吗 ? 


10.43 土壤 中 含水 量 . 确定 土壤 中 含水 量 的 标准 方 


法 涉及 土壤 搬 动 和 土 量 估计 Forest Engineering 
(1999 年 7 月 ) 介 绍 了 一 种 不 需要 搬 动 , 即 一 种 称 
为 放射 法 的 间接 方法 . 新 方法 利用 含水 量 和 土壤 发 
出 的 热能 化 氨 中 子 数 成 比例 的 事实 ,在 深 10 在 处 
收集 了 56 个 土 芯 的 样本 ; 对 于 每 个 土 芯 , 利用 标 
难 方法 确定 含水 量 和 放射 法 确定 氧 中 子 个 数 . 数据 
的 简单 线性 回归 得 到 下 面 结 果 ， 
y=0.088 +0. 136x, r -0.84 

H y=zkË(g/cm°), x = 计数 比 ( 氢 中 子 除 以 
标准 计数 ). 
a. 解释 最 小 二 乘 直线 估计 的 y RE. 
b. 解释 最 小 二 乘 直线 估计 的 斜率 . 
e. 检验 斜率 是 否 为 0 的 p 值 确定 为 0.0001, 解释 

这 个 结果 . 
d. 解释 的 值 . 


10.44 ”图表 交互 模型 . 混合 算法 知觉 模型 ( MA-P) 


是 图 示 交 互 作用 的 合成 模型 , 是 基于 人 和 计算 机 
图 形 显示 的 交互 作用 的 分 析 发 展 起 来 . 发 表 于 SIC- 
CHI Bulletin(1993 年 7 月) 的 一 篇 研究 文章 检验 了 
MA-P 模型 的 假定 . 利用 简单 线性 回归 , 研究 者 把 
标准 图 问题 中 的 响应 时 间 y( ms) 作为 解决 问题 要 
求 的 运行 步骤 数 * 的 函数 建 模 . 对 n=8 个 问题 的 
回归 结果 汇总 如 下 : 

y=1346 +450x, 7? =0.91 
a. 解释 6, 的 值 . 
b. ffr 的 值 . 
c 在 a=0.01 进行 模型 恰当 性 的 检验 . (提示 : 从 
相关 系数 + 值 的 检验 出 发 ) 


理论 练习 
10.45 验证. 


Q 55,5 2 
Bir SS,. 和 SSE=SS, (1-7?) 





10.46 利用 练习 10.45 的 结论 证 明 


prwvn-27 


SA SS. g /1-r 
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10.9 利用 模型 估计 和 预测 


如 果 我 们 对 已 经 找到 的 描述 绝缘 材料 压缩 量 和 压力 之 间 关系 的 有 用 模型 比较 满意 , 即 已 完成 最 
初 的 建 模 目 标 : 对 某 个 特殊 的 压力 水 平 , 利用 它 来 估计 或 预测 压缩 量 . 

概率 模型 最 普遍 的 用 途 可 以 分 为 两 类 . 模型 的 第 一 类 用 途 是 对 某 个 特殊 的 X 值 ,估计 的 均值 
ELY) ,对 我 们 的 例子 , 想 估计 受到 40 (a =4)1b/in2 压力 时 所 有 绝缘 样品 压缩 量 的 平均 值 . 模型 的 第 
二 类 用 途 是 对 给 定 的 x 需要 预测 实际 的 y 值 . 即 如 果 决定 把 绝缘 材料 放 在 一 种 特定 装置 中 ,在 该 装 
置 中 认为 绝缘 材料 将 受到 40 Ib/in? 的 压力 ,对 这 种 特殊 的 绝缘 材料 样品 我 们 想 预 测 它 的 压缩 量 . 

在 估计 y 的 均值 情形 , 对 给 定 的 x 值 , 试图 估计 非常 多 次 试验 的 平均 结果 . 在 第 二 种 情形 , 对 给 
定 的 x 值 , 我 们 企图 预测 一 次 试验 的 结果 . 在 模型 的 应 用 中 ,期 望 得 到 哪 _ 种 情况 的 更 多 成 功 。 即 我 
们 可 以 更 准确 地 估计 (或 预测 )y 的 平均 值 或 个 别 值 

在 回答 这 个 问题 之 前 , 首先 考虑 选择 y 均值 (或 个 别 值 ) 的 估计 (或 预测 值 ) 问题 我 们 将 利用 最 
小 二 乘 异型 

y - B * Bux 
对 一 个 给 定 的 * 值 来 估计 y 的 均值 和 预测 y 的 特殊 值 . 对 我 们 的 例子 , 得 到 
y= -0.140.7x y 
PUES x =4 IN (40 lbyinz 的 压力 ) BERTA AR MOM l 
平均 压缩 量 为 ; 
y= -0.1+0.7(4) 22.7 

或 0.27 in(y 的 单位 是 十 分 之 一 英寸 ) 4 z = 4 时 ， 
用 相同 的 值 预测 y 值 , 即 当 x=4 PP, y 的 估计 平均 什 
和 预测 值 都 等 于 》=2.7, 如 图 10. 17 所 示 . 

模型 两 种 用 途 的 不 同 在 于 估计 值 和 预测 信 相 应 的 准 
Webb. 当 最 小 二 乘 直 线 分 别 用 于 估计 值 和 预测 值 时 ， 准 


确 性 的 最 好 度量 是 最 小 二 乘 直线 的 重复 抽样 误差 . 这 些 | 2 3 4 5 
误差 在 下 面 框 格 中 给 出 . 图 10.17 对 x=4, 压缩 量 y 的 估计 的 


均值 和 预测 的 个 别 值 
》 的 均值 E(y) 的 估计 量 和 个 别 y 的 预测 值 的 抽样 误差 
L 在 x 的 某 个 值 处 如 %,，E(y) 的 估计 量 了 的 抽样 分 布 标准 差 为 : 


1 (z,-x)° 
o, =c |— += 


Y n SS 


xx 








0 L— L i | 














其 中 oo 是 随机 误差 & 的 标准 差 . 
2. 对 x=%, ,个别 y 的 预测 值 了 的 预测 误差 的 标准 盖 为 : 


1 工 (z, 522 
07-7 50 t> + SS. 


c 的 真 值 是 很 少 知道 的 , 因此 , 我 们 用 * 估计 o, 并 且 如 下 面 框 格 中 所 示 那 样 计 算 置 信 区 间 和 预 





其 中 og 是 随机 误差 & 的 标准 差 . 
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aM px a]. 





对 X=‰，yY 的 均值 E( y) ËJ (1 -a) 10096 RERA 
Ft? 的 估计 标准 差 ) 


y tt 1l G, 73) -2) 
y a25 n ss. 


XP x=x,, 个 别 y 值 的 (1 —o)10096 预测 区 间 
yz+ta((y-7) 的 估计 标准 差 ) 


y +t ps plu OR 9 
Y Etan n SS. 


GENIA 当 压 力 是 40 Ib/in? 时 ， 求 绝缘 材料 平均 压缩 量 的 95% 置信 区 间 . 
解 对 于 40 Ib/in 的 压力 x, 4, 并 且 因为 n=5, df=n -2-3. W y KRK ESKE. 


y+t 1 (s, 22 
y+ a/25 n SS,, 
v tomes L4 C 37 
Y X19. 025 5 SS, 


回忆 y=2.7, 520.61, x-3 B SS, 2 10. 从 表 B.7 知 , to 02s =3. 182. 因此 ， 


2.7 + (3. 182) (0.61) E (4 2» 72.7 + (3.182) (0.61) (0.55) 22.7 «1.1 2(1.6,3.8) 


记 住 压缩 量 (y) 以 0. 1 in 为 测量 单位 ， 当 绝缘 材料 受到 40 Ibin? 的 压力 时 ,我 们 估计 区 间 0. 16 < 
0.38 i 包含 了 这 个 平均 压缩 量 . 注意 为 了 说 明 , 在 拟 合 最 小 二 乘 直线 时 只 利用 了 少量 的 数据 ,如 果 利 
用 大 量 数据 , 区 间 宽度 可 以 减 小 . 
预测 受到 40 Ib/in? 的 压力 时 单个 绝缘 材料 的 压缩 量 . 利用 95% 预测 区 间 . 

解 为 了 预测 某 一 特定 绝缘 材料 在 x, =4 时 的 压缩 量 , 计算 95% 预测 区 间 为 ， 


A 1 (w, -3)? 1 (4-3)? 
jeras jis nT SS, =2.7 = (3.182) (0. 61) /1 + 5 + 


72.7 x (3.182) (0. 61) (1.14) =2.7 +2.2 = (0.5,4.9) 
因此 ， 我 们 预测 单个 绝缘 材料 的 压缩 量 将 落 在 区 间 0. 05 — 0. 49 in E. 如 yy 平均 值 的 置信 区 间 情 形 一 
FÉ, y 的 预测 区 间 也 相当 大 . 这 是 因为 我 们 选择 了 一 个 拟 合 最 小 二 乘 直 线 的 简单 例子 ( 只 有 5 个 数据 
A), 利用 大 量 的 数据 点 ， 预测 区 间 的 宽度 可 以 减 小 . 











匠 中 iz 基 于 (nn 一 2) 个 自由 度 . 











或 者 

















RC 中 ta 基于 (ma -2) 个 自 BA. 
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E(y) 的 置信 区 间 和 y 的 预测 区 间 都 可 以 利用 统计 软件 获得 . 图 10. 18 是 给 出 置信 区 间 和 预测 区 
间 的 MINITAB 输出 ,这 些 区 间 ( 着 重 显示 的 ) 除 了 四 舍 五 人 外 与 我 们 计算 的 区 间 一 致 . 对 压力 x 的 各 
DE, y 的 均值 的 置信 限 和 y 未 来 值 的 预测 限 的 比较 在 图 10. 19 中 给 出 . 值得 注意 的 是 单个 y 值 的 预 
测 区 间 总 是 比 y 均值 的 置信 区 间 宽 , 检查 这 两 个 区 间 的 公式 可 以 看 到 这 个 结论 , 也 可 以 在 图 10. 19 
中 看 到 这 个 结果 . 





Predicted Values for New Observations 


New 
Obs Fit SE Fit 95% CI 95% PI 
1 2.700 0.332 11.645, 3.755) (0.503,. 4.897] 


Values of Predictors for New Observations 








New 
Obs PRESS X 
1 4.900 
L 





8110.18 E(y) 的 置信 区 间 和 y 的 预测 区 间 的 MINITAB 输出 
另外 , 在 整个 样本 数据 范围 内 , 随 着 值 远离 x, 两 个 区 间 的 宽度 将 增加 ( 见 图 10. 19). 因此 ,x 
偏离 = 越 大 , 区 间 在 实际 中 的 作用 越 小 . 事实 上 ， 当 选择 的 x 离 了 足够 远 以 至 于 落 在 样本 数据 范围 以 
外 时 , 对 E(y) 或 y 进行 的 任何 推断 都 是 危险 的 , 解释 如 下 . 






---77 $ 7-0.1407x 


95% 置信 限 
NP | 95% 预 测 限 











L l I | | d l I L l l x 
0 05 10 LS 20 25 30 35 40 45 5.0 5.5 60 


样本 中 x 的 范围 
图 10. 19 95% 园 信 区 间 和 预测 区 间 宽 度 的 比较 
警告 :对 落 在 样本 数据 范围 之 外 的 x 值 ， 利 用 最 小 二 乘 预 测 方程 来 估计 y 的 均值 或 预测 的 特定 
值 可 能 导致 估计 或 预测 误差 比 期 望 的 大 很 多 . 尽管 最 小 二 乘 模型 对 包含 在 样本 的 x 值 范围 之 内 数据 
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提供 很 好 的 拟 合 ， 对 这 个 区 域 之 外 的 x 值 ， 它 可 能 给 出 真实 模型 的 一 个 不 好 的 表示 . 

为 了 结束 这 一 节 , 我 们 将 求 *=x， BET 值 的 方差. 这 个 方差 在 建立 x = x, 时 E(y) 的 置信 区 间 , 以 
及 x = x, 时 特定 y 值 的 预测 区 间 中 起 着 重要 作用 . 
K x= x, 时 ?了 值 的 方差， 

解 当 x=%, 时 , 有 了 =Bo +Bix,， 其 中 Bo - y - By. 把 它 代 人 7 表达 式 中 的 Bo, 我 们 得 到 


y = (y - Bix) +B) Gy) =y +6 x, -x) 
下 一 步 是 把 y 表 成 随机 7y Ey, ya soo, Yn 的 线性 函数 , 如 此 就 可 以 将 Y(7) 作为 独立 随机 变量 线 


性 函数 的 方差. 现在 有 
y=7+Bi (x, 3) = T+ 
把 了 表示 成 一 个 和 式 : 





(xy 7X) 
SS 


> (x; 


x,-x)(x;-x) 
SS Yi 





zy 
n 


-x)y; = 


(x, -Xx)(x;-x) 





ie 
Bl y 是 独立 变量 yi ， Yis Ut 


SS, ”i 


| Yn 的 线性 函数 ,其 中 y; 的 系数 为 : 





[++ (x, . $2] 

















由 定理 6.8, 
—%) (x; -x)42 
v) = y| Gee P] vo 
EP Vy) 207, i21,2, =, n. 因此 ， 
^ 1 2(x,-X)x;-x) (x,-x)!(x;-x)? 
"m — 88. ^ (85, je 
n 2 (x 一 元) 一 元 ) 
-[5 P Es X (x, —x) + (S5. y X(x-x) ?| 
1 (x - 
-[ += (S5. ss. (HEX E (x; - x) 20) 


Gr I5 
LR 


Sus 


可 以 看 到 这 与 本 节 前 面 给 出 的 公式 是 到 的 


应 用 练习 
10.47 EKRAR AE. 参考 练习 10.7, Ameri- 
can Ceramic Society Bulletin(2005 年 2. H ) 用 于 熔炼 
TES FERE IYEN. 
a. 求 平均 孔隙 直径 x = 10 km 砖 的 表 观 孔隙 率 y 的 
95% 预测 区 间 , 解释 结论 . 
b. x=10 pm 时 平均 孔隙 率 E(y) 的 95% 置信 区 间 
H a 中 的 预测 区 间 宽 还 是 窗 ? 解释 之 . 
10.48 溢出 液体 的 渗 开 速度 . 参考 练习 10.8. Che- 


micial Engineering Progress (2005 年 1 月) 溢出 的 易 

挥发 液体 流 经 表面 时 渗 开 速度 的 研究 . 

a. 在 流 经 时 间 x = 8 min 时 , 求 所 有 溢出 液体 平均 
质量 E(y) 的 90% 和 置信 区 间 , 解释 结论 . 

b. 在 x=% 时 , 平均 质量 E(y) 的 90% 置信 区 间 比 a 
中 的 置信 区 间 宽 还 是 窗 ? 解释 之 . 

10.49 估计 降雨 量 的 新 方法 . 参考 练习 10.9, Jour- 
nal of Data Science( 2004 年 4 月 ) 估 计 降 雨量 方法 的 
评价 . 当 神 经 网 络 估计 量 为 x=3 mm 时 , 求 雨量 计 
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WEE y 的 99% 预测 区 间 , 解释 结论 . 

10.50 THRA. 参考 练习 10.10 对 n 224 HE 
汁 样 品 中 果 胶 量 x 与 甜 度 指标 y 之 间 的 简单 线性 
回归 . 分 析 的 SPSS 输出 如 下 所 示 , 关于 每 个 x 值 的 
平均 甜 度 指标 E( y) 的 90% 置信 区 间 在 SPSS 数据 
表 中 给 出 . 选择 一 个 观测 值 并 解释 这 个 区 间 . 

10.51 散热 铜 管 的 热 性 能 . 参考 练习 10.12, Journal 
of Heat Transfer (1990 年 8 月 ) 整体 散 热 铜 管 的 研 
究 . 当 未 涌 入 面积 比 为 x = 1.95 BF, 求 平均 热 传 递 
系数 的 90% 置信 区 间 , 解释 结论 . 

10.82 预测 树 高 . 在 森林 学 中 , 树 腰 直 径 ( 相 当 容易 
测量 ) 常 用 来 预测 树 的 高 度 ( 很 难 获 得 的 度量 ). 在 


不 列 颠 哥伦比亚 北部 森林 工作 的 森林 学 家 进行 了 一 

系列 植 距 试验 来 预测 一 些 树 的 高 度 , 下 表 中 数据 是 

36 个 白云 杉 样本 的 树 腰 直径 (cm) 和 高 度 (m). 

a， 建 立 数据 的 散 点 图 . 

b. 假定 变量 之 间 关 系 可 以 用 一 条 直线 很 好 地 描述 ， 
利用 最 小 二 乘 方法 估计 y 截 距 和 直线 斜率 . 

c. 在 散 点 图 中 画 出 最 小 二 乘 直线 . 

d. 数据 能 提供 充分 的 证 据 表 明 树 腰 直 径 x 对 树 高 
7 的 预测 贡献 信息 吗 ? 利用 a = 0.05 进行 

e. 利用 最 小 二 乘 直 线 , 求 树 腰 直径 为 20 em BF, 白 
云 杉 平均 高 度 的 90% 置信 区 间 , 解释 这 个 区 间 . 
















































































上 run | sweet pectin lower90m upper90m 
l 1 1 5.2 220 5.64898 5.83848 
2 2 5.5 227 5.63898 5.81613 
3 3 6.0| 259 5.57819 5.72904 
af 4 59| mis 5.66194 5.87173 
3, 5 5.8 224 5.64337 5.82560 
6 6 6.0 215 5.65564 5.85493 | 
7 7 5.8 231 5.63284 5.80379 
8 8 5.6 = 5.55553 5.11011, 
9 9 5.6 239 5.61947 5.78019 
10 10 5.9 212 5.65946 5.86497 
L 11 11 5.4 410 5.05526 5.55416 
12 12| 56 256| 5.58517 | 5.73592 
= 5.43785 5.65219 

















5.57819 

















5.68213 
















































































BES. — dE, 
(em) (m) 
22.9 19.8 
14.1 18.5 
10.1 12.1 
5.8 8.0 
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( 续 ) ( 续 ) 
树 腰 直径 x EH y 树 腰 直 径 x ”高 度 y f 有 效 寿命 (h) 
Cem) (m) | (em) (m) 切割 速度 (m/min) REA RD 
23.6 18.9 20.7 17.4 40 5.2 6.0 
14.8 13. 3 17.8 18.4 40 4.0 45 
22.7 20.6 11.4 17.3 40 2.5 5.0 
18. 5 19. 0 14.4 16. 6 50 4.4 4.5 
21.5 19.2 13.4 12.9 50 2.8 4.0 
14.8 16.1 17.8 17. 5 50 1.0 3.7 
17.7 19.9 20.7 19.4 60 4.0 3.8 
21.0 20.4 13.3 15.5 60 2.0 3.0 
15.9 17.6 22.9 19.2 60 1.1 2.4 
资料 来 源 : Scholz, H. , Northern Lights College, British Co- 70 1.1 1.5 
lumbia. 70 0.5 2.0 
10.53 ”切割 工具 的 寿命 试验 . 为 了 提高 任何 生产 过 70 3.0 1.0 


程 的 产量 , 首先 需要 了 解 过 程 的 能 力 ( Deming, Out 

of the Crisis, 1982). 在 某 制 造 过 程 中 ,一 -种 切割 工 

具 的 有 效 寿 命 与 这 种 工具 运行 速度 是 线性 关系 . 下 

表 的 数据 是 对 两 种 不 同 品牌 的 切割 工具 在 通常 生 

产 过 程 中 进行 寿命 试验 获得 的 . 

a. 对 品牌 A 的 数据 拟 合 模型 EC) = p, +B1x, 其 
中 y= 有 效 寿命 ,x = 切割 速度 . 

b. 对 品牌 B 重复 问题 a. . 

c. 利用 90% 置信 区 间 估 计 品 牌 A 切割 工具 在 切割 
速度 为 45 m/min 时 的 平均 有 效 寿命 . 对 品牌 B 
切割 工具 重复 上 面 估计 . 比较 这 两 个 区 间 的 宽 
度 并 评论 不 同 的 原因 . 

d. 利用 90% 预测 区 间 预 测 当 切割 速度 为 45 m/min 
时 品牌 A 切割 工具 的 有 效 寿命 . 对 品牌 B 切割 
工具 重复 上 面 预测 . 比较 这 两 个 区 间 和 c 中 计 
算 区 间 的 宽度 . 评论 不 同 的 原因 . 

e. 注意 在 e 和 d 中 是 对 不 在 原始 样本 中 的 * 值 执 
行 估计 和 预测 ， 即 值 x = 45 不 是 样本 的 一 部 分 . 
然而 这 个 值 在 样本 x 值 范围 之 内 ,因此 回归 模 
型 可 以 对 这 个 * 值 进行 估计 和 预测 , 在 这 种 情 
形 下 , 估计 和 预测 表示 内 推 . 








有 效 寿 命 (h) 
切割 速度 (m/min) 
品牌 A 品牌 B 
30 4.5 6.0 
30 3.5 6.5 
30 5.2 5.0 





—————qAOAÁ— => - 


假定 要 求 预测 品牌 A 切割 工具 在 切割 速度 为 x 
=100 m/min 时 的 有 效 寿命 , 因为 给 定 的 * 值 在 
样本 x 值 范围 之 外 ,预测 是 外 推 的 一 个 例子 . Ti 
测 品牌 A 切割 工具 在 100 m/min 运行 时 的 有 效 
寿命 , 构造 工具 实际 有 效 寿命 的 95% 置信 区 间 . 
为 了 保证 外 推 的 有 效 性 , 需要 什么 样 的 附加 
假定 ? 


理论 练习 


10. 54 ”假定 想 利用 预测 方程 =B e Bue 预测 > = x, 
时 y 的 未 来 值 ,预测 误差 是 实际 值 y, 和 预测 值 ? 
之 间 的 差 , 即 预测 误差 =y, -多 
a 解释 为 什么 预测 误差 是 正 态 的 ? 

b， 求 预测 误差 的 期 望 值 和 方差 . 

10.55 解释 为 什么 

z- BRE n- 
误差 的 标准 差 o, G 











是 标准 正 态 随机 变量 . 
10.56 证 明 : 
T = 预测 误差 - Y-Y 
估计 的 误差 标准 差 I (x,-x)? 
s /1 + 一 -+ SS 





服从 自由 度 为 v= (n - 2) EAE T Zi. 
10.57 ”利用 练习 10.56 中 了 统计 量 作为 枢 轴 统 计量 
SP y, 的 (1 — a) 00% 预测 区 间 . 
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10.10 ”一 个 完整 的 例子 
在 前 面 几 节 中 , 介绍 了 拟 合 和 应 用 直线 回归 模型 必要 的 基本 要 素 . 在 这 节 , 将 把 这 些 要 素 用 于 





一 个 例子 中 , 并 利用 计算 机 执行 计算 . 表 10.7 火灾 赔偿 金 数据 
假定 一 家 火灾 保险 公司 想 建 立 重大 住宅 火灾 的 火灾 — EA OFE C 
赔偿 金 和 住宅 与 最 近 消 防 站 距离 的 关系 . 研究 在 一 个 主 x( mile) y( 千 美元 ) 
要 城市 的 较 大 郊区 进行 ; 选择 了 这 个 郊区 最 近 的 15 次 3.4 26.2 
火灾 作为 样本 , 记录 每 场 火灾 的 赔偿 金 y 和 火灾 与 最 近 1.8 17.8 
消防 站 之 间 的 距离 x, 结果 在 表 10.7 中 给 出 . 23 - 
步骤 1 首先 ,假定 一 个 联系 火灾 赔偿 金 y 和 与 最 " " 
近 消 防 站 距离 的 模型 . 假定 是 一 个 直线 概率 模型. 5.5 36.0 
y=pBo +Bix +e 0.7 14.1 
步骤 2 其 次 , 把 数据 输入 计算 机 , 并 利用 统计 软 ç " 
件 包 估计 假定 模型 确定 性 分 量 的 未 知 参数 . 简单 线性 回 1 3 31 3 
归 分 析 的 SAS 输出 在 图 10. 20 给 出 . 2.1 24.0 
Bo fll B, 的 最 小 二 乘 估计 (在 输出 中 着 重 显示 ) X: L1 17.3 
Bo -10.277929, — 8, =4. 919331 i ; " 
因此 , 最 小 二 乘 方程 (四 合 五 人 后 ) Y: 3.8 26.1 


y=10.278 +4. 919x 
这 个 预测 方程 在 图 10.21 的 MINITAB 数据 散 点 图 中 给 出 . 


斜率 的 最 小 二 乘 估计 B， = 4. 92 ， 意味 着 与 消防 站 距离 每 增加 1 mile, 估计 的 平均 赔偿 金 增加 


4 920 美 元 . 这 个 解释 在 x 范围 , 或 者 是 距离 消防 站 从 0.7 — 6. 1 mile 之 内 有 效 . iit y ERE ñ, =10. 28 
解释 为 火灾 距离 消防 站 0 mile 时 估计 的 平均 赔偿 金 为 10280 美元 . 尽管 这 似乎 只 适用 于 消防 站 本 身 ， 


记 住 仅 当 * 20 在 自 变量 抽样 范围 之 内 ,7 截 距 具有 有 意义 的 解释 . 因为 x =0 在 范围 之 外 ， 所 以 Bo 没 
有 实际 解释 . 

FRI 现在 , 指定 随机 误差 分 量 的 概率 分 布 ， 关于 分 布 的 假定 与 10. 2 节 列 出 的 一 样 . 

1. E(e) =0. 

2. 对 所 有 的 * 值 , Var( e) = o2 为 常数 . 

3. e 具有 正 态 分 布 . 

4. e 是 独立 的 . 

尽管 知道 这 些 假定 不 一 定 完 全 满足 (对 任何 实际 问题 它们 很 少 满足 ) ， 我 们 愿意 假定 对 这 个 例子 
它们 近似 地 满足 . 

e 的 方差 o? 的 估计 是 输出 中 的 阴影 部 分 , 为 s? =5. 36546 (这 个 值 也 称 为 均 方 误差 或 MSE. ) 

2 的 估计 的 标准 差 ( 也 在 输出 中 着 重 显示 ) 为; 

s =2.31635 

这 个 * 值 意味 着 大 部 分 观测 的 火灾 赔偿 爹 (y) 落 在 它们 各 自 预测 值 的 约 为 2; = 4. 64 x 1000 美元 

之 内 . 
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Dependent Variable: DAMAGE 
finalysis of Variance 
Sum of Mean 
Source DF Squares Square F Value P > F 
Model 1 841.76636 841.76636 156.89 «0.0001 
Error 13 69.75098 5.36546 
Corrected Total 14 911.51733 
Root MSE 2.31635 R-Square 0.9235 
Dependent Mean 26.41333 fidj R-Sq 0.9176 
Coeff Var 8.76961 
Parameter Estimates 
Parameter Standard 
Variable DF Estimate Error t Value Pr > It! 95Z Confidence Limits 
Intercept 1 10.27793 1.42028 7.24 «0.0001 7.20950 13.34625 
DISTANCE 1 4.91933 0.39275 12.53 «0.0001 4.07085 5.76781 
Üutput Statistics 
Dep Var Predicted Std Error 
Obs DISTANCE DAMAGE Value Mean Predict 95% CL Predict Residual 
1 3.4 26.2000 27.0037 0.5999 21.8344 32.1729 -0.8037 
2 1.8 17.8000 19.1327 0.8340 13.8141 24.4514 -1.3327 
3 4.6 31.3000 32.9068 0.7915 27.6186 38.1951 -1.6068 
4 2.3 23.1000 21.5924 0.7112 16.3577 26.8271 1.5076 
5 3.1 27.5000 25.5279 0.6022 20.3573 30.6984 1.9721 
6 5.5 36.0000 37.3342 1.0573 31.8334 42.8351 -1.3342 
7 0.7 14.1000 13.7215 1.1766 8.1087 19.3342 0.3785 
8 3 22.3000 25.0359 0.5081 19.8622 30.2097? -2.7359 
8 2.6 13.6000 23.0682 0.6550 17.8678 28.2686 -3.4682 
10 4.3 31.3000 31.4311 0.7198 26.1908 36.6713 -0.1311 
11 2:1 24.0000 20.5085 0.7566 15.3442 25.8729 3.3915 
12 1.1 17.3000 15.6892 1.0444 10.1999 21.1785 1.6108 
13 6.1 43.2000 40.2858 1.2587 34.5906 45.9811 2.9142 
14 4.8 36.4000 33.8907 0.8450 28.5640 39.2175 2.5093 
15 3.8 26.1000 28.9714 0.6320 23.7843 34.1585 -2.8714 
16 3.5 27.4956 0.6043 22.3239 32.6672 
Sum of Residuals 0 
Sum of Squared Residuals 69.75098 
Predicted Residual SS (PRESS) 93.21169 
图 10. 20 ”火灾 赔偿 金 线性 回归 的 SAS 输出 
赔偿 金 对 距离 的 散 点 图 
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图 10.21. 火灾 赔偿 金 数据 的 MINITAB 散 点 图 及 最 小 二 乘 模型 
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步骤 4 现在 可 以 检验 假设 模型 的 效用 ,， 即 * 是 否 真 的 在 利用 直线 模型 对 y 预测 中 提供 了 


a. 检验 模型 的 效用 . 首先 , 检验 斜率 B1 为 0 的 原 假设 , 即 火 灾 赔 偿 金 与 最 近 消防 站 距离 之 间 没 
有 线性 关系 , 对 x 和 y 是 正 线性 相关 的 备 择 假设 . 我 们 检验 : 
Hy: Bı =0 
H : B, >0 
输出 中 阴影 的 检验 统计 量 值 为 了 =12.525, I p f&( 也 着 重 显示 的 ) 为 0.0001. 
因此 , 单 人 出 上 尾 检 验 的 p 值 为 : 


p= n = 0. 00005 


因为 a=0.05 超过 这 个 小 的 p 值 , 有 足够 的 证 据 拒绝 H, 并 断定 火灾 与 消防 站 之 间 的 距离 对 火灾 赔 
偿 金 的 预测 贡献 了 信息 , 随 着 距离 的 增加 火灾 赔偿 金 也 增加 . 

b. 久 率 的 置信 区 间 . 由 构成 斜率 B1 的 置信 区 间 , 可 获得 关于 关系 的 额外 信息 . B, 的 95% 置信 区 
间 ( 输 出 中 着 重 显示 ) 为 (4. 070, 5.768). 我 们 以 95% 置信 从 4070 美元 到 5768 美元 的 区 间 包 含 了 与 
消防 站 距离 每 增加 1 英里 火灾 赔偿 金 的 平均 增加 量 (B; ). 

c. 模型 恰当 性 的 数值 描述 性 度量 . 决定 系数 (输出 中 着 重 显示 的 ) 为， 

r? =0. 9235 
这 意味 着 火灾 到 消防 站 之 间 的 距离 x 解释 了 火灾 赔偿 金 (y) 中 样本 变异 的 92% 

相关 系数 > 度量 y 和 x 之 间 线 性 关系 强度 , 在 图 10. 20 中 没有 显示 . 利用 简单 线性 回归 中 = Vr2 

和 r 50, 有 相同 符号 的 事实 , 我 们 有 
r= +Vr = 0.9235 =0.96 
大 的 相关 系数 证 实 了 By 不 为 0 的 推断 ; 看 来 火灾 赔偿 金 和 消 防 站 的 距离 是 线性 相关 的 . 

£i 检验 的 结论 , ”的 大 值 和 相对 小 的 2s 值 (步骤 3), 都 指出 x 和 之 间 有 和 较 强 的 线性 关系 . 

步骤 5 ”现在 准备 利用 最 小 二 乘 模型 . 假定 保险 公司 想 预 测 火灾 赔偿 爹 ， 如 果 在 距离 最 近 消防 站 
3.5 mile 处 发 生 了 一 场 严重 的 住宅 火灾 , B x, =3.5. 在 SAS 输出 (阴影 部 分 ) 的 底部 显示 预测 值 为 
y 221.4956, 相应 的 95%% 预测 区 间 ( 着 重 显示 ) 为 (22. 3239 , 32.6672). 因此 , 我 们 预测 (以 95% =: 
信 ) 对 发 生 在 距离 最 近 消防 站 3.5 mile 处 严重 的 住宅 火灾 , 火灾 赔偿 爹 将 在 22324 美元 和 32 667 美元 
之 间 . 

告 : 不 能 利用 这 个 预测 模型 对 距离 最 近 消 防 站 少 于 0.7 mile 和 多 于 6.1 mile 的 家 庭 进行 预测 ， 
+ 10.7 中 数据 显示 了 所 有 的 * 值 都 落 在 0.7 ~6.1 之 间 . 回忆 10.9 节 利 用 模型 对 样本 数据 区 域外 的 
预测 是 危险 的 ， 当 推广 到 值 更 广 范围 时 ， 一 条 直线 可 能 不 会 提供 y 的 平均 值 和 x 值 之 间 关 系 的 
好 模型 . 


10.11 简单 线性 回归 步骤 的 小 结 


我 们 在 这 一 章 介绍 了 一 种 非常 有 用 的 工具 一 一 用 预测 方程 拟 合 数据 集 的 最 小 二 乘法 , 这 个 过 
程 , 与 有 关 的 统计 检验 和 估计 一 起 , 称 为 回归 分 析 . 我 们 用 5 个 步骤 说 明 怎样 用 样本 数据 建立 一 个 联 
系 因 变量 y 和 单个 自 变量 x 的 模型. 
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简单 线性 回归 分 析 的 步骤 
L 第 一 步 是 假设 一 个 概率 模型 . 本 章 中 , 我 们 限定 为 直线 模型 了 9, +B x + e. 
2. 第 二 步 是 利用 最 小 二 乘法 估计 确定 性 分 量 B, +Bix 的 未 知 参数 . 最 小 二 乘 估计 得 到 一 个 误差 平方 和 


(SSE) 比 其 他 任何 直线 模型 的 SSE 都 小 的 模型 = 局 +É, x. 

3. 第 三 步 是 指定 随机 误差 分 量 s 的 概率 分 布 . 

4 第 四 步 是 评价 假设 模型 的 效用 . 这 里 包括 关于 斜率 B, 的 推断 、 计 算 相 关系 数 ， 和 决定 系数 六. 

5 RE, 如果 对 模型 满意 ， 就 准备 利用 它 . 对 给 定 的 x 值 利用 模型 估计 yy 的 均值 ECy) ， 对 某 个 特殊 的 
x 值 预测 yÉ. 











快速 复习 
重要 公式 
B. =s ° Bo =y- Bx B 的 最 小 二 乘 估计 


d n 
-yp CEx 
SS, = Xx n 
y=Bo Bus 最 小 二 乘 直线 
SSE = E (y; -7)? = SS， -BiSS,, 误差 平方 和 


其 中 ss = zp -OED* 











= s 估计 的 e 的 方差 oz 
= $ + Q — 1: 
58 7 SE 估计 的 B, 的 标准 误差 
n . 
E Hy: B, -0 的 检验 统计 量 
ĝi 
B CO Bi 的 (1 — a) 10096 置信 区 间 
Ss,, 2 ama 
EN s * V” ESG) 相关 系数 
xx" yy 
SS, - SSE 
dE 决定 系数 


232 
ETON | CR" Mx oa, it, ECO) RC — a) 1009 EE IS] 
= 
tü) fle CRY Macc, 时 , y 的 (1 -a)100% 预测 区 间 
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符号 汇集 
和 号 
y 因 变 量 ( 被 预测 的 变量 或 建 模 变量 ) 
x 自 ( 预测 ) 变量 
E(y) y 的 期 望 ( 均 ) 值 
Bo Bo 真实 直线 的 y WE 
Bi rs 真实 直线 的 斜率 
B B0 hat y 鹤 距 的 最 小 二 乘 估计 
n B- hat y 斜率 的 最 小 二 乘 估计 
e epsilon 随机 误差 
p y hat y 的 预测 值 
(y-5) 预测 的 误差 
SSE 误差 平方 和 (对 最 小 二 乘 直 线 是 最 小 的 ) 
SS + 值 的 平方 和 
ss, 7 值 的 平方 和 
ss, x 的 平方 和 y S x-y 
r 相关 系数 
p? RJ 决定 系数 
x 用 来 预测 y 的 x 值 
m E LLL 
本 章 简要 提示 


e 简单 线性 回归 中 两 个 定量 变量 : y = 因 变 量 ( 即 被 预测 的 变量 ) 和 x = 自 ( 即 预测 ) 变量 . 

° y 概率 模型 的 一 般 形 式 : y = E(y) +e. 

e 简单 线性 ( 直线 ) 模型 Y =Po * Bx + s. 

° 斜率 (B1 ) 表 示 * 每 增加 1 个 单位 y 的 改变 量 . 

* y 截 距 (po ) 表示 直线 截 y 轴 处 的 值 . 

e 简单 线性 回归 的 步骤 : (1) 假设 模型 ; 《2) 利 用 最 小 二 乘法 估计 未 知 的 B; (3) 给 出 随机 误差 的 
假定 ; (4) 统 计 评价 模型 的 恰当 性 ; (5) 如 果 认 为 有 用 ， 利用 模型 估计 和 预测 . 

。 最 小 二 乘法 的 性 质 (1) 预测 误差 的 和 为 0; (2) 预 测 的 误差 平方 和 最 小 . 

o 斜率 和 y 截 距 的 估计 值 只 能 在 样本 x 值 范 围 之 内 解释 . 

° = 的 四 个 假定 : (1)e 的 均值 为 0; (2) 对 所 有 的 x 值 , e 的 方差 为 常数 ; (3) 6 的 分 布 是 正 态 的 ; 
(4) e 值 是 独立 的 . 

° 解释 e 的 估计 的 标准 差 : 观测 的 y 值 有 95% 左右 落 在 各 自 预 测 值 的 2s 以 内 . 

° 用 村 评价 模型 恰当 性 的 统计 学 : (1)B; 的 假设 检验 ; (2)B, 的 置信 区 间 ; (3) 相关 系数 r; 
(4) Bog SX 2. 

° 相关 系数 的 范围 : - 1< rsl. 
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e 决定 系数 的 范围 : 0< r sl. 
e 相关 系数 度量 HL y 之 间 线 性 关系 的 强度 . 


e 决定 系数 给 出 可 以 由 直线 模型 解释 的 y 样本 变异 比例 . 


e° 不 要 认为 高 度 相 关 意味 着 x 引起 y. 


e 对 给 定 的 x 值 , E(y) 的 置信 区 间 比 y 的 预测 区 间 要 罕 . 


(Dk ye Rz F4 33 

10.58 ”量子 隧 穿 . 在 温度 接近 绝对 零度 ( 27310) 
时 , 氨 呈 现 的 特性 违反 许多 传统 的 物理 学 定律 . 进 
行 了 一 个 关于 固体 形态 氨 在 多 种 接近 绝对 零度 温 
度 下 的 试验 . 固体 氮 和 不 纯 固 体 物质 一 同 放 在 稀释 
制冷 机 里 , 记录 通过 固体 氨 的 杂质 比例 ( 按 重量 )， 
(固体 直接 穿 过 固体 现象 称 为 量子 隧 穿 .) 数据 在 
下 表 中 给 出 . 





通过 毛 杂 质 比 例 y 温度 x(% ) 

0.315 -262 
0. 202 -265 
0. 204 -256 
0. 620 -267 
0.715 -270 
0. 935 -272 
0. 957 -272 
0. 906 -272 
0. 985 -273 
0. 987 -273 

a. 构造 数据 的 散 点 图 . 

b.， 求 数据 的 最 小 二 乘 直线 并 画 在 散 点 图 上 . 

c. 在 问题 的 背景 中 定义 B. 

d. 检验 假设 : 利用 直线 模型 ， 温度 对 预测 通过 氨 


的 杂质 比例 没有 贡献 信息 (a = 0.05 ) ， 作 出 恰 
当 的 结论 . 

e. 3K B, 的 90% 置信 区 间 , 并 解释 结论 . 

. 求 给 定数 据 的 相关 系数 . 

. 对 b 中 建立 的 直线 模型 , 求 决定 系数 ,解释 
结论 . 

h， 当 温度 设 定 为 -270% 时 , 求 通过 氮 杂 质 比例 的 
99% 预测 区 间 ， 

i， 当 温度 设 定 为 - 270 时 , 估计 通过 氨 杂 质 比例 
的 均值 , 利用 99% 置信 区 间 . 

10.59 AREARE. 多 伦 多 大 学 的 植物 学 家 进行 

了 一 系列 试验 调查 锥 雪 各 的 饲养 习惯 . (Journal of 


ga r^ 


Applied Ecology, 1995 年 32 35. ) ERER ASNE 

们 的 肠子 空 了 , 然后 允许 喂食 规定 的 植物 或 Purina 

MS 6 h. 对 每 个 喂养 试验 , 将 2.5 h Jo ME RS RC 

变化 记录 为 初始 体重 的 百分比 ,其 他 两 个 记录 变 

量 是 消化 效率 (以 百分比 度量 ) 和 消化 道中 酸 净化 

纤维 量 ( 以 百分比 度量 ). 保存 在 SNOWGEESE 文 

件 中 的 42 个 饲养 试验 数据 列 出 如 下 . 

a. 植物 学 家 对 体重 的 改变 (y) 和 消化 效率 (x) 之 间 
的 相关 性 感 兴趣 . 在 散 点 图 中 画 出 这 两 个 变量 
的 数据 , 能 观测 到 趋势 吗 ? 

b. 求 体 重 的 改变 (y) 和 消化 效率 (x) 之 间 的 相关 系 
数 , 解释 这 个 值 . 





(前 5 个 和 最 后 5 个 观测 值 ) 
、 体重 变化 ”消化 效率 ” 酸 净 化 
饲养 试验 食物。 (%) (w) 纤维 (%) 
1 . 植物 0 28.5 
2 植物 2.5 27.5 
3 植物 5 27.5 
4 植物 0 0 32.5 
5 植物 2 0 32 
38 R 9 59 8.5 
39 BE 12 52.5 8 
40 BE 8.5 75 6 
41 BE 10.5 72.5 6.5 
42 [gw 14 69 7 


资料 来 源 ; Gadallah, F. L., and Jefferies, R. L. “ Forage 
quality in brood rearing areas of the lesser snow goose and the 
growth of captive goslings. ” Journal of Applied Biology. Vol. 
32, no. 2, 1995, p. 281282( 由 图 2 和 3 改编 ). 


c. 进行 检验 来 确定 体重 改变 y 是 否 与 消化 效率 x 
相关 , 利用 a =0. 05. 

d. 重复 b 和 e, 但 是 分 析 中 除去 喂养 鸭 食 的 试验 数 
据 , 能 推出 什么 结论 ? 

e. 植物 学 家 同样 对 消化 效率 y 和 酸 净 化 纤维 x 之 间 
的 相关 性 感 兴趣 , 对 这 两 个 变量 重复 a ~ d 问题 . 
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波长 的 比 , 这 些 颜 色 比 列 在 下 表 中 . 依照 研究 人 员 
的 话 ,“ 数 据 的 线性 趋势 暗示 , 这 种 比 是 具有 红色 
光谱 的 卡 西 尼 区 域 和 具有 平缓 色调 光谱 的 南极 区 
域 这 两 端的 混合 .“ 对 数据 进行 简单 线性 回归 分 析 
端 结论 支持 研究 人 员 的 陈述 吗 ? 


10.60 土星 卫星 的 颜色 分 析 , 最 近 卡 西 尼 太 空 船 得 
到 了 土星 最 大 卫星 之 一 土 卫 八 的 高 分 辩 率 图 像 ， 
并 由 美国 国家 航空 和 宇宙 航行 局 分 析 . ( Science , 
2005 4E 2 月 25 H). 利用 宽频 带 滤 波 器 , 在 24 个 
卫星 位 置 度量 了 从 紫外 线 到 绿色 和 红外 线 到 绿色 








区 域 红外 / 绿 紫外 / 绿 | 区 域 红外 / 绿 紫外 / 绿 

卡 西 尼 区 域 1.52 0. 64 明亮 带 1.13 0.79 
1.51 0.65 1.20 0.80 

1.54 0.65 1.22 0.80 

1.53 0.66 1.19 0.81 

过 渡 区 域 1. 44 0. 66 1.21 0. 82 
1.42 0.69 1.16 0.83 

1.42 0.70 1.14 0. 88 

1.28 0. 73 1.13 0.89 

1.40 0.75 南极 1.02 0.94 

1.24 0.75 0.98 0.95 

1.32 0.77 1.01 0.99 

1.26 0.77 1. 00 1. 00 





资料 来 源 : Porco, C. C. , et al. “Cassini imaging science; Initial result on Phoebe and lapetus. ” Science. Vol. 307, No. 5713 , Feb. 
25, 2005( E] 8). 


10.61 电磁 传播 的 研究 . 美国 联邦 通信 委员 会 (FCC) — 10.62 发 现 非 晶 质 合金 具有 较 高 的 耐 蚀 性 ，Corro- 


指定 在 一 个 户外 检验 场地 测量 数字 装置 中 放射 性 电 
磁 传 播 . 为 了 核实 检验 站 的 可 接受 性 , 必须 评价 站 
衰减 ( 即 当 两 个 偶 极 天 线 放 在 地 平面 上 时 , 从 一 个 半 
波 偶 极 天 线 的 输入 到 另 一 个 偶 极 天 线 的 输出 的 传输 
损耗 ). 在 科罗拉多 州 的 科林斯 堡 某 检验 站 进行 的 研 
究 得 到 关于 站 衰减 (dB) 和 相距 3 m 偶 极 天 线 的 传播 
频率 ( MHz) 数 据 . 传播 频率 (x) 是 否 为 站 衰减 (y) 的 
有 用 线性 预测 量 ? 利用 a =0.05 检验 





传播 频率 *( MHz) 站 衰减 y(dB) 

50 11.5 
100 15.8 
200 18.2 
300 22.6 
400 26.2 
500 27.1 
600 29.5 
700 30. 7 
800 31.3 
900 32.6 


1 000 34. 9 
资料 来 源 : Bennett, W. S. “ An error analysis of the FCC site- 
attenuation approximation. ” IEEE Transactions on Electromag- 
netic Compatibility, Vol. EMC-27 , No. 3, Aug. 1985, p. 113 


(CEN), © 1985IEEE. 


sion Science ( 1993 年 9 月 ) 发 表 了 结晶 化 后 非 晶 质 铁 
硼 硅 合金 的 电阻 率 研究 . 5 种 合金 样品 在 700%C ,每 
个 以 不 同 的 时 间 长 度 退火 . 然后 测量 每 个 样品 的 钝 
化 电势 一 一 退火 合金 的 电阻 率 度量 , 试验 数据 在 这 
里 给 出 . 





结晶 时 间 x( min) 钝 化 电势 y(mV) 
10 -408 
20 - 400 
45 -392 
90 -379 
120 -385 


资料 来 源 ， Chattoraj, I. , et al. “Polarization and resistivity 
measurements of post-crystallization changes in amorphous Fe- 
B-Si alloys. ” Corrosion Science, Vol. 49, No. 9, Sept. 1993, 
p. 712( E 1). 


确定 结晶 时 间 (x) 是 否 是 钝 化 电势 (y) 的 一 个 有 用 
预测 量 . 如 果 是 , 求 结晶 时 间 设 置 为 x = 30 min 时 
的 平均 钝 化 电势 ECy) , 利用 90% 置信 区 间 . 


10.63 有 机 化 学 实验 . 九州 大 学 (日 本 ) 的 化 学 家 调 


查 了 间 芳 环 化 合 物 的 最 大 吸收 率 y( mmol ) 和 哈 梅 特 
取代 常数 x 之 间 的 线性 关系 (Journal of Organic 
Chemistry, 1995 年 7 月 ). TREO HI Y ve 
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表 中 给 出 , 化 合 物 1 的 变异 用 1a、 1b, 1d, le, 1f, 1g 记号 , 能 观察 到 什么 ? 
Mih dm; 化 合 物 2 的 变异 用 2a、2b、2c 和 2d pb， 只 对 化 合 物 1 的 数据 拟 合 模型 E(y) = Bo +Bix. 
表示 . c. 评价 b 中 模型 的 恰当 性 . 取 a =0.01. 
化 合 物 最 大 吸收 哈 梅 特 常数 4 只 用 化 合 物 ? 的 数据 重复 > 和 
H y BM z 10.64 ”融雪 水 径流 流失 . 美国 农业 部 已 经 开发 并 采 
la 298 0.00 用 通用 的 土壤 损失 方程 ( USLE) 来 预测 土壤 的 水 流 
1b 346 0.75 失 . 在 融化 雪 径流 普遍 的 地 理 区 域 , 计算 USLE 要 
ld 303 0. 06 求 融雪 水 径流 流失 的 准确 估计 . 在 Journal. of Soil 
w. " " ^ and Water Conservation( 1995 年 3 月 至 4 月 ) 上 的 一 


篇 文章 利用 简单 线性 回归 得 到 融雪 水 流失 指标 . 用 


0. 42 
M Loo 加 拿 大 54 个 气候 站 的 数据 建 模 ,把 MeCool 冬季 调 
2 3⁄3 0.52 整 降雨 量 流失 性 指标 y 作为 五 年 一 次 融雪 水 径流 
2b 367 L0 8 s (omm) 的 直线 函数 
I a. 数据 点 的 散 点 图 在 下 面 给 出 . 存在 明显 的 线性 趋 
2c 325 0. 37 势 吗 ? 
— 2 5 "= hb 由 于 在 研究 期 ,降雪 量 缺乏 , 从 分 析 中 删 掉 7 个 
资料 来 源 : Adapted from Tsuge. A. , et al. “ Preparation and 站 的 数据 . 为 什么 这 种 策略 是 可 取 的 ? 
spectral properties of disubstituted [ 2-2 ] metacyclophanes. " c. 对 余下 的 m = 47 个 数据 点 的 简单 线性 回归 得 到 


Journal of Organic Chemistry, Vol, 60, No. 15, July 1995, 


结果 :了 = —6.72 +1.39x, s? =0. 06. 
pp. 4390-4391 ( 3& 1 和 图 1). FUSE , > M 利用 


这 些 信 息 构造 B, 的 90% 置信 区 间 . 
a. 画 出 数据 的 散 点 图 . 对 两 种 化 合 物 用 两 种 不 同 的 d. 解释 c 中 的 区 间 . 


McCool 冬季 调整 雨量 





0 100 200 300 400 500 
5 年 一 次 的 冬季 径流 量 (mm) 


简单 线性 回归 
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10.65 不锈钢 的 裂缝 . 对 304 型 不 锈 钢 在 模拟 的 沸 
水 反应 器 环境 下 进行 重力 腐蚀 裂 锋 的 研究 试验 
( Transaction of the ASME , 1986 年 1 月 ). 在 具有 溶 
解 氧 和 硫酸 盐 的 289% 水 中 , 在 多 种 压力 强度 因 
素 下 ( 即 载荷 ), 退火 和 敏 化 6 个 不 锈 钢 样 品 . 表 
中 给 出 了 6 个 样品 的 最 大 载荷 和 相应 的 裂缝 增长 
速度 (m/s). 

c 


P 300 356 41.5 502 55.5 611 
a'm 


裂缝 增长 速度 

m/s x 1079 
资料 来 源 : Park, J. Y. ; Ruther, W. E. , Kassner, T. F., 
and Shack, W. J. , “Stress corrosion crack growth rates in 


10 22 3.9 5.8 5.0 140 


Type 304 stainless steel in simulated BWR environments. " 
Transactions of the American Society of Mechanical Engineers, 
Vol. 108, No. 1, Jan. 1986, p. 23( 34). 


a. 有 充分 的 证 据说 明 裂 链 增长 速度 随 着 最 大 载荷 
线性 增长 吗 ? 用 a =0. 10 检验 . 
b. 在 最 大 载荷 每 增长 了 个 单位 时 , 利用 90% g 
信 区 间 佑 计 裂 锋 增 长 速度 的 平均 增加 量 ， 解 
10.66 ”混凝土 管 的 强度 . 下 表 给 出 了 关于 混凝土 管 
径 向 张力 强度 研究 中 获得 的 部 分 数据 (Journal of 
the American Concrete Institute , 1983). 用 于 试验 的 混 
凝 土管 内 径 为 84 in, 壁 厚 大 约 8.75 in. 另外 , 它 用 
冷 拉 制 钢丝 加 固 . 响应 y 是 直到 观测 到 管 样品 第 一 
个 裂缝 的 载荷 (lb/ft) ， 自 变量 * 是 试验 时 样品 的 年 
RCR). 进行 数据 的 完整 简单 线性 回归 分 析 , 并 解 
释 结论 . 


载荷 (Ib/ft) 













年 龄 (天 ) | 载荷 (Ib/&) ECR) 





11 450 20 10 540 25 
10 420 20 9 470 31 
11 142 20 9 190 31 
10 840 25 9 540 31 





11170 
资料 来 源 : Heger, F. J. ，and McGrath, T. J. , “ Radial ten- 
sion strength of pipe and other curved flexural members. ” Jour- 
nal of the American Concrete Institute, Vol. 80, No. 1, 1983 ; 
p. 33-39. 


10.67 控制 玉米 锈病 . 在 纽约 州 ， 通常 的 玉米 锈病 
是 甜 玉 米 的 一 种 严重 疾病 . 尽管 杀菌 剂 对 控制 玉米 
锈病 是 有 效 的 , 但 使 用 时 机 很 重要 . 根据 玉米 锈病 
影响 范围 和 疾病 严重 性 的 回归 方程 , 研究 者 开发 了 
关于 杀菌 剂 施用 开始 作用 的 界限 ( Phytopathology , 


Vol. 80, 1990). 在 某 块 田 地 里 , 收集 了 100 HE 
米 杂 交 的 数据 . 对 每 株 植 物 , 影响 范围 用 叶子 感染 . 
比例 度量 (*) , 严重 程度 用 每 片 叶 子 感染 平均 数 的 
log( 以 10 为 底 ) 值 (y) 度 量 . 数据 的 简单 线性 回归 
分 析 产 生 如 下 结果 : 

y= -0.939 +0.020x r=0.816 s =0.288 


解释 B, 的 值 . 

RR r WE. 

解释 s 的 值 . 

计算 + 值 并 解释 

. 利用 d 的 结果 , 检验 模型 的 效用 , 取 a =0.05. 
(假定 n=100. ) 

E 当 玉 米 锈病 影响 范围 是 80% 时 ,预测 疾病 严重 
TE. (E: 取 了 的 反对 数 (10 为 底 ) 得 到 每 片 叶子 
感染 平均 数 的 预测 ) 


° PP = p 


10.68 原油 的 热 氧 降解 . 热 重 分 析 平衡 (TC ) 是 为 了 


评价 化 合 物 热 性 能 而 开发 的 一 种 技术 . Abou EI Na- 

ga 和 Salem( 1986) 比较 了 评价 原油 和 它们 的 饱和 加 

混 ( 例 如 变压器 油 、 透 平 油 和 润滑 油 ) 热 氧化 稳定 

性 的 TG 技术 与 标准 方法 . 对 10 种 原油 的 样本 , 利 

用 TG 技术 确定 在 氧化 点 形成 的 氧化 化 合 物 含量 y， 

并 用 标准 方法 确定 氧化 产品 的 总 百分比 x, 试验 结 

果 在 下 表 中 给 出 . 

a. 用 简单 线性 模型 拟 合 由 TG 技术 确定 的 氧化 化 合 
物 含量 y 和 由 标准 方法 确定 的 氧化 产品 的 总 百 
分 比 x. 

b. 在 散 点 图 中 画 出 数据 点 和 最 小 二 乘 直 线 . 


c. 解释 B, 和 局 的 值 . 
d. 计算 SSE, s? #l s. 





e. 解释 s 的 值 . 
原油 TG 技术 : 氧化 化 合 标准 方法 ; 总 氧化 产物 

物 量 y(% 重 量 ) x(%) 
1 25.4 2.3 
2 27.11 2.5 
3 28.0 2.65 
4 17.9 1.3 
5 18.9 1.45 
6 22.9 1.9 
7 30.8 3.3 
8 18.6 1.4 
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( 续 ) ( 续 ) 
原油 TOER: 氧化 化 合 标准 方法 总 氧化 产物 高 出 周围 的 温度 了 HAH 
` Vt y( % 3E BL) x(%) 20 50 
9 24.4 2.1 12 30 
10 29.8 2.9 15 45 
资料 来 源 ; Abou EI Naga, H. H. , and Salem, A. E. M. 22 60 


“ Base oils thermooxidation" , Lubrication Engineering. Vol. 24, 
No. 4, Apr. 1986, p. 213. Reprinted by permission of the 
American Society of Lubrication Engineers. All rights reserved. 


10.69 大 容量 空气 抽样 器 . 美国 环保 署 对 环境 空气 
质量 的 总 悬浮 颗粒 建立 了 工业 的 和 职业 的 标准 . 大 
容量 空气 采样 器 (用 于 采样 总 悬浮 颗粒 的 标准 设 
备 ) 把 悬浮 颗粒 收集 到 大 过 滤器 上 . 名 称 大 容量 来 
自 于 空气 采样 器 具有 高 的 采样 流动 速度 (以 标准 
m/min 度量 ) 的 事实 . 由 于 这 个 高 的 流动 速度 , 在 
24 h 抽样 期 间 收 集 了 大 量 颗粒 . 然而 , 流动 速度 是 
随 着 穿 过 过 滤 介 质 的 压力 (inH:0) 落差 而 变化 . 进 
行 一 项 试验 来 调查 流动 速度 和 压力 落差 之 间 的 关 
R. 在 8 种 抽样 环境 中 完成 大 容量 空气 采样 , 得 到 
平均 流动 速度 (y) 和 穿 过 过 滤 介 质 的 压力 落差 (xz) 
的 度量 , 列 于 下 表 . 


流动 速度 y ”压力 落差 x | 流动 速度 y 压力 落差 x 








0.92 10 1.56 18 
1.25 15 1.10 13 
0.60 8 0.65 9 
1.13 12 1.33 15 


a 基于 过 滤器 的 压力 落差 , 利用 数据 建立 一 个 预测 大 
容量 空气 采样 器 平均 流动 速度 的 简单 线性 模型 . 

b. a 中 的 模型 对 预测 流动 速度 有 用 吗 ? (Was 
0.05. ) 

e. 利用 95% 预测 区 间 ， 预测 穿 过 过 滤器 压力 落差 
为 11 mH,0 时 采样 环境 的 流动 速度 . 

10.70 太阳 能 研究 . 由 于 安装 和 运行 花费 的 减少 ， 
被 动 式 和 主动 式 太阳 能 系统 成 为 房屋 建设 者 可 行 
的 选择 . 层 状 太阳 能 电池 组 件 利用 高 质量 的 , 单 晶 
硅 太 阳 电 池 串 联 释放 指定 的 能 量 输出 , 进行 研究 来 
调查 太阳 能 电池 高 出 周围 环境 的 温度 (°C ) 和 绝缘 
量 (MW/em ) 之 间 的 关系 ,收集 在 相同 试验 条 件 下 








抽样 的 6 个 太阳 能 电池 数据 记录 在 下 表 中 ， 
高 出 周围 的 温度 y 绝缘 量 x 

9 25 

25 70 





. 对 数据 拟 合 最 小 二 乘 直线 . 

. 通 出 点 和 直线 作为 计算 的 检验 . 

. 计算 r+ 和 ,解释 它们 的 值 . 

. 模型 对 预测 高 出 周围 的 温度 有 用 吗 ? (利用 a = 
0.01. ) 

e 对 绝缘 量 为 35 MW/cm° 的 太阳 能 电池 估计 高 出 

周围 的 平均 温度 , 利用 99% 置信 区 间 . 


a ° Tp 


10.71 IZAR. 最 近 的 民事 诉讼 围绕 着 坐落 在 


纽约 布朗 克 斯 的 5 个 砖 建筑 公寓 大 楼 ,它们 开始 遭 
3B 9] 2515.8 ( 即 一 部 分 砖 表面 与 砖 分 离 ). 大 楼 的 业 
主 声 称 砖 制造 加 工 是 有 缺陷 的 ; 砖 生产 厂商 反驳 说 
拙劣 的 设计 和 管理 不 善 导 致 损坏 . 为 了 解决 诉讼 ， 
要 求 估计 每 1 000 块 砖 的 损坏 率 ,， 称 为 剥落 率 . 
(Chance, 1994 年 夏 ) 业 主 用 一 些 脚手架 下 落 调查 
估计 剥落 率 . (利用 这 种 方法 , 工程 师 把 脚手架 下 
落 到 建筑 墙 的 选 定位 置 , 并 在 观测 区 域 计算 每 
1 000 块 砖 的 可 见 剥 落 数 . ) 砖 制造 厂商 把 大 楼 的 墙 
分 成 83 个 小 块 并 对 每 个 小 块 拍照 进行 它们 自己 的 
剥落 砖 抉 调查 . (记录 下 每 张 照 片上 辨认 的 剥落 砖 
块 数 , 并 把 83 个 小 块 加 起 来 作为 总 的 剥落 损坏 的 
估计 . ) 在 这 个 法 庭 案 例 中 , 法 官 面 临 着 如 下 的 困 
R: 脚手架 下 落 调查 提供 了 给 定 那 块 墙 最 准确 的 估 
计 . 不 幸 的 是 , 下 落 区 域 不 是 从 整个 大 楼 随机 选取 
的 ; 而 是 下 落 在 损坏 集中 的 区 域 , 导致 高 估 了 总 
损坏 . 





" rant 
TEDE QT AR) — (Rio 000 i) 

1 0 0 

2 5.] 0 

3 6.6 0 

4 1.1 0.8 

5 1.8 1.0 

6 3.9 1.0 

7 11.5 1.9 

8 22.1 7.7 
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简单 线性 回归 
( 续 ) 
n FEHER 照片 剥落 率 
下 沙 位 置 451000 Be) (每 1000 Hee) 
9 39. 3 14.9 
10 39.9 13.9 
11 43.0 11.8 


资料 来 源 : Fairley, W. B. , et al. "Bricks, buildings, and 
the Bronx; Estimating masonry deterioration. " Chance, Vol. 
7. No. 3, Summer1994, p. 36. {图 3)( 注 ; 数据 点 是 由 散 
点 图 中 给 出 的 数据 估计 的 . ) 


男 一 方面 , 照片 调查 完成 了 大 楼 所 有 83 小 块 的 剥 
落 损 坏 检 查 . 但 是 照片 估计 的 剥落 率 , 至 少 在 剥落 
集中 的 高 区 域 是 偏 低 的 (剥落 损坏 不 是 总 能 在 照片 
中 看 到 ) ,导致 低估 了 总 体 损坏 . 

表 中 数据 是 在 11 个 下 落 位 置 利 用 两 种 方法 得 
到 的 剥落 率 . 利用 这 些 数据 ,作为 此 案 中 见证 的 专 
业 统 计 学 家 , 帮助 法 官 估计 在 给 定 的 一 小 块 墙 上 的 
IER. 然后 解释 这 个 信息 怎样 与 83 个 小 块 上 的 
数据 (没有 在 此 给 出 ) 一 起 , 可 以 对 总 剥落 损坏 提 
供 一 个 合理 的 估计 ( 即 损坏 砖 的 总 数 ). 


活动 中 的 统计 学 ; 探矿 魔杖 真 的 能 发 现 水 吗 

仅仅 利用 一 种 迷信 方法 的 木 叉 式 探矿 会 来 寻找 地 下 水 源 的 行为 常 被 称 为 “探矿 魔杖 ”. 尽管 科学 
家 广泛 地 认为 这 只 是 中 世纪 时 期 迷信 的 遗 俗 ,探矿 魔杖 仍 在 民间 传说 中 流行 ,到 今天 , 有 个 别人 声 
称 具 有 这 种 神秘 的 技能 . 

德国 的 许多 魔杖 勘探 者 声称 他 们 对 从 水 源 散发 出 的 “地 球 射 线 ” 有 反应 , 魔杖 勘探 者 们 说 , 这 些 
射线 是 对 人 类 健康 有 潜在 危险 的 放射 物 的 微妙 形式 . 作为 这 些 宣称 的 结果 , 1980 年 代 中 期 德国 政府 
进行 了 2 年 的 试验 来 调查 魔杖 具有 真实 技能 的 可 能 性 . 如 果 这 种 技能 能 够 演示 、 说 服 政府 官员 , 那么 
可 以 发 现 、 避 免 和 除 掉 德国 危险 放射 物 水 平 . 

向 德国 慕尼黑 的 一 组 大 学 物理 学 家 提供 400 000 马克 ( 约 250 000 美元 ) 拨款 进行 研究 . 招募 到 大 
约 500 魔杖 勘探 候选 人 参加 他 们 技能 的 初步 测试 . 为 避免 葡 骗 性 的 宣称 , 选 出 在 初步 测试 中 看 来 最 
成 功 的 43 个 人 选 进 行 最 后 的 , 仔细 控制 的 试验 . 

研究 者 在 一 个 空谷 仓 的 地 上 放 了 一 条 10 m KHAT, 沿 着 它 可 以 移动 小 型 手推车 . 把 小 段 管子 
放 在 小 型 手推车 上 , 垂直 于 测试 绳 , 通过 软 管 和 有 流水 的 抽水 机 连接 . 每 次 试验 中 管子 沿 着 绳子 的 
位 置 是 由 计算 机 产生 的 随机 数 指派 . 在 谷 仓 的 上 层 , 试验 绳 的 正 上 方 , 画 一 条 10 m 长 的 测试 线 . 每 次 
试验 中 ,允许 一 个 魔杖 勘探 者 进入 上 层 并 要 求 用 他 或 她 的 魔杖 , 棒 或 选择 的 其 他 工具 确定 地 面 层 有 
流水 管子 的 位 置 . 

每 个 魔杖 勘探 者 至 少 参加 一 个 测验 系列 , 即 5 ~ 15 次 试验 (一 般 为 10 次 ) , 每 次 试验 后 管子 随机 
地 重新 放置 .( 某 些 魔杖 勘探 者 仅 参 加 一 个 测验 系列 , 挑选 其 他 人 参加 超过 10 个 测验 系列 . ) 经 过 为 
期 2 年 的 试验 , 43 个 魔杖 勘探 者 共 参 加 了 843 次 测验 . 试验 是 “ 双 讶 的 ”"， 上 层 的 观察 者 (研究 者 ) 和 
魔杖 勘探 者 都 不 知道 管子 的 位 置 , 即使 在 猜测 以 后 . (IE: 试验 开始 之 前 , 专业 魔术 师 对 勘探 者 的 可 
能 诡计 或 欺骗 全 部 进行 了 检查 . ) 

对 每 次 试验 记录 两 个 变量 : 管子 的 实际 位 置 (从 绳子 起 点 的 分 米 数 ) 和 魔杖 勘探 者 们 的 猜测 (也 
以 分 米 度 量 ). 基于 这 些 数 据 的 检查 , 德国 物理 学 家 在 他 们 最 后 的 报告 中 断言 尽管 实际 上 大 部 分 魔杖 ` 
勘探 者 在 试验 中 做 的 不 特别 好 ,“ 一 小 部 分 勘探 者 , 在 个 别 的 测验 中 , 显示 出 了 意外 高 的 成 功率 , JL 
乎 不 能 用 巧合 解释 所 有 这 些 …… 勘 探 者 现象 的 实际 核心 可 以 看 作 是 经 验 的 证 明 ……. " ( Wagner, Betz, 
and König, 1990). 7 

这 个 结论 受到 加 利 福 尼 亚 -圣地亚哥 大 学 教授 J T. Enright 的 批评 性 评价 (Skeptical Inquirer , 
1999 年 1/2 月 ). Enright 集中 在 三 个 “最 好 ”的 魔杖 勘探 者 (序号 为 99,，18 和 108). 这 些 魔杖 勘探 者 
中 的 每 一 个 都 进行 了 多 次 试验 , 而 且 给 出 这 三 个 人 中 的 每 个 最 好 的 测验 序列 (一 系列 试验 ). 这 些 数 
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据 保存 在 文件 DOWSING F, 列 于 表 SIA10. 1 rh. 

对 每 次 试验 , < x = 魔杖 勘探 者 猜测 (dm) , y = 管子 位 置 (dm). 确定 “最 好 的 ”魔杖 勘探 者 是 否 
有 效 的 一 个 方法 是 对 表 SIA10. 1 中 的 数据 拟 合 直线 模型 E(y) = Bo +Bix. 

数据 的 MINITAB 散 点 图 在 图 SIA10. 1 中 给 出 . 从 图 SIA10. 2 MINITAB 回归 输出 中 得 到 的 最 小 二 
乘 直线 也 画 在 散 点 图 中 . 尽管 最 小 二 乘 直 线 有 轻微 的 向 上 趋势 , 数据 点 在 直线 周转 的 变异 是 大 的 . 这 
不 能 说 明 魔 杖 勘探 者 的 猜测 (x) 是 管子 实际 位 置 (y) 的 很 好 预测 . 检验 原 假设 Hy: By =0( 输 出 中 着 重 
PR) BRN p 值 为 p=0.118. 即使 对 如 o = 0. 10 那样 高 的 a 水 平 , 也 没有 足够 的 证 据 拒绝 Hy. W 
此 , X SIA10. 1 魔杖 数据 对 德国 研究 者 的 宣称 , 三 个 最 好 的 魔杖 勘探 者 具有 利用 探矿 魔杖 找到 地 下 
水 源 的 能 力 , 不 提供 统计 支持 . 

用 直线 斜率 的 置信 区 间 使 “魔杖 ”理论 缺乏 支持 更 加 清楚 . 当 =26 时 , df = (n -2) =24, to 02s = 
2.064, 代入 这 些 值 和 MINITAB 输出 中 相应 值 , p, 的 95% 置信 区 间 为 ， 

Bi + to. 025 (55 ) 20.31 + (2.064) (0.19) 20.31 +0. 39 gk( —0.08, 0. 70) 
因此 , 魔杖 勘探 者 猜测 每 增加 1 dm, 我 们 估计 (95% 置信 ) 管 子 的 实际 位 置 将 在 减少 0. 08 dm 到 增加 
0.70 dm 的 范围 内 . 换 句 话说 , 不 能 保证 管子 的 位 置 沿 着 10 dm 长 的 管道 是 增加 还 是 减 小 ! 还 请 记 
住 , X SIA10. 1 中 的 数据 代表 三 个 魔杖 勘探 者 “最 好 的 ”表现 ， 即 这 些 魔杖 试验 的 输出 是 最 有 利 的 结 
A. 如 果 考 虑 所 有 试验 数据 和 图 形 , 更 不 存在 些微 趋势 了 . 
R SIA10. 1 ”魔杖 试验 结果 : 三 个 最 好 魔杖 勘探 者 的 最 好 系列 





试 mm 魔杖 勘探 者 编号 管子 位 置 魔杖 勘探 者 猜测 
1 99 4 4 
2 99 5 87 
3 99 30 95 
4 99 35 74 
5 99 36 78 
6 99 58 65 
7 99 40 39 
8 99 70 75 
9 99 74 32 

10 99 98 100 
11 18 7 10 
12 18 38 40 
13 18 40 30 
14 18 49 47 
15 18 75 9 
16 18 82 95 
17 108 5 52 
18 108 18 16 
19 108 33 37 
20 108 45 40 
21 108 38 66 
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(XE) 
ko 验 魔杖 勘探 者 编号 管子 位 置 魔杖 勘探 者 猜测 
2 ' 108 52 74 
24 108 63 65 
25 108 72 60 
26 108 95 49 


资料 来 源 : Enright, J. T. “Testing dowsing: The failure of the Munich experiments. ” Skeptical Inquirer. Jan/Feb. 1999, p. 45. (图 6a). 





管子 对 猜测 的 散 点 图 
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图 SIA10. 1 魔杖 数据 的 MINITAB 散 点 图 





| The regression equation is 
GUESS Y —30.07440.3084 0.700 PIPE X 


Predictor Coef SE Coef T P 
Constant 30.0737 11.4139 2.63 0.015 
PIPE X 0.3079 0.1900 1.62 0.118 
S: = 26.02981 R-Sq = 9.9$ R-Sq(adj) = 6.1$ 


Analysis of Variance 








Source DF SS MS: F P 
Regression 1 1778.925 1778.925 2.62552 0.118 
Residual Error 24 16261.23 839)8812 

Total 25 18040.15 || 





图 SIA10.2 3€ 10. 1 中 数据 的 MINITAB 简单 线性 回归 


第 11 章 多 重 回归 分 析 


目标 ”将 第 10 章 的 方法 推广 到 基于 2 个 或 多 个 自 变量 预测 响应 y 的 一 个 程序 ,描述 可 以 从 这 类 
分 析 得 到 实际 推断 的 类 型 . 


11.1 ”多重 回归 模型 的 一 般 形 式 


实际 应 用 中 , 使 用 的 大 多 数 回归 分 析 模 型 都 比 第 10 章 中 的 简单 线性 模型 更 复杂 . 例如 , 住宅 火 
灾 赔 偿 金 的 真实 概率 模型 , 应 包括 比 10. 10 节 仅 考虑 与 消防 站 距离 更 多 的 因素 , 如 房屋 的 大 小 、 建 
筑 材料 以 及 对 火灾 损害 的 评估 , 这 些 因素 是 可 能 影响 火灾 赔偿 金 的 许多 变量 中 的 一 部 分 . 因此 ,如 
果 需 要 做 正确 的 预测 , 就 要 把 这 些 和 另外 可 能 重要 的 自 变量 纳入 模型 . 

包括 超过 一 个 自 变 量 的 概率 模型 称 为 多 重 回归 模型 , 下 面 给 出 了 这 些 模 型 的 一 般 形式 . 因 变 量 y 
可 以 写成 下 个 自 变量 0,0. ，…， 你 的 函数 , 随机 误差 项 使 得 模型 是 随机 的 而 非 确定 的 . 当 其 他 (有 — 
1) 个 自 变 量 保持 不 变 时 , 系数 Bi; 的 值 确定 自 变 量 x; 的 贡献 , Bo 是 y 的 截 距 . 系数 Bo , Bl ，…, Bi 通常 
是 未 知 的 , 因为 它们 表示 总 体 参数 . 





一 般 多 重 回归 模型 的 形式 
y=Bo *Bix, +B,x, + o +B,x, + £ 
其 中 , y 是 因 变 量 ;jxl ， m. z 2 B E E; E(y) =Bo Bos +B,x, +…+Bixs 是 模型 的 确定 性 部 分 , B; 确 定 
自 变 量 xU Ya BR. 
注 : 符号 xi ,x,，…, 入 可 能 表示 定量 预测 值 的 高 阶 项 或 表示 定性 预测 值 的 项 . 











初 看 起 来 , 这 里 显示 的 回归 模型 只 容许 y 与 自 变量 之 间 的 关系 是 直线 , 而 不 能 是 任何 其 他 关系 ， 
但 事实 并 非 如 此 . 实际 上 , x, xz，…，, x; 可 以 是 自 变 量 的 函数 ,只 要 这 个 函数 不 包含 未 知 参 数 . 例 
如 ,香烟 释放 烟雾 中 的 一 氧化 碳 含量 y 可 能 是 下 列 自 变量 的 函数 : 
x = 焦油 含量 
X5 一 (焦油 含量 )? = 好 
x, =T， 如 果 是 过 滤 嘴 香烟 ; x, =0, 如 果 不 是 过 滤 嘴 香烟 
轧 称 为 高 阶 项 ,因为 它 是 定量 变量 x 的 平方 ( 即 自 乘 二 次 的 短 ). x; 是 编码 变量 , 表示 定性 变量 (过滤 
嘴 类 型 ). 多 重 回归 模型 的 用 途 相 当 广泛 , 能 够 对 许多 不 同类 型 的 响应 变量 建 模 . 
一 旦 选 定 了 联系 EO) 与 自 变量 集合 的 模型 ， 多 重 回归 分 析 的 步骤 与 简单 线性 回归 分 析 的 步 双 
类 似 . 唯一 不 同 的 是 , 涉及 的 数学 理论 超出 了 本 书 的 范围 ,而 且 计算 更 复杂 . 在 下 一 节 , 我 们 将 概述 
多 重 回归 分 析 的 基本 假定 , 介绍 模型 参数 的 估计 和 假设 检验 方法 . 对 指定 的 自 变量 值 , 说 明 如 何 寻 
找 E(y) 的 置信 区 间或 y 的 预测 区 间 ， 因 为 大 多 数 多 重 回归 分 析 是 通过 计算 机 来 完成 的 , 我 们 将 演示 





O ”模型 之 所 以 称 为 一 般 线性 模型 是 因为 E(y) 是 未 知 参数 Bo , Bi , 6: , … 的 线性 函数 . 模型 
E(y) =pBoe 9* 
不 是 线性 模型 ， 因 为 E(y) 不 是 未 知 模型 参数 B, 和 8, 的 线性 函数 . 
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如 何 解释 由 统计 软件 输出 的 结果 . 





分 析 多 重 回归 模型 
步骤 1 假设 模型 的 确定 性 分 量 . 这 个 分 量 联系 均值 EQ) 5 ERE, x, U, mu, 也 涉及 包括 在 模型 中 的 
自 变 量 选择 . 
SUR 用 样本 数据 估计 模型 中 的 未 知 参数 Bobis Bos s Be 
步骤 3 指定 随机 误差 e 的 概率 分 布 ,估计 这 个 分 布 的 标准 差 c. 
步骤 4 检查 e 的 假定 是 否 满足 ， 如果 必要 ,对 模型 进行 修正 . 
步骤 5 对 模型 的 恰当 性 进行 统计 评价 . 
FRO 如 果 模 型 是 满意 的 , 就 可 利用 它 进 行 预测 、 估 计 和 其 他 目的 . 














11.2 模型 假定 


当选 择 了 回归 模型 的 确定 性 分 量 , BD E(y) 的 模型 ,增加 一 个 分 量 作 为 随机 误差 的 补偿 . 
y=E(y) +e 

这 个 分 量 必须 服从 简单 线性 回归 模型 的 假定 , 即 服从 均值 为 0、 方差 等 于 2 的 正 态 分 布 . 进一步 ,我 
们 假定 与 任何 一 对 y 对 应 的 两 个 随机 误差 是 独立 的 . 

为 了 给 出 参数 估计 公式 , 我 们 将 EO) 写成 标准 形式 . 因此 , RIE 

E(y) =Bo *Bixi +B2x2 + © + By; 

是 包含 Bo 和 上 个 涉及 预测 变量 项 模型 的 确定 性 分 量 . 模型 中 的 * 值 与 11.1 节 中 相同 ,例如 , <, RT UI 
是 好 , x3 可 以 是 sin(x,) FẸ. 本 质 是 当 观 测 到 一 个 y 值 时 ， 这 些 量 xl，x2 ，…， 引 可 以 被 没有 误差 地 
测量 , 而 且 他 们 不 包含 任何 未 知 参数 . 

下 面 框 格 将 给 出 线性 回归 模型 和 相应 的 假定 . 在 11. 10 节 , 我 们 将 讨论 如 何 使 用 回归 残 差 来 确 
定 这 些 假定 是 否 满足 RAE y 的 观测 值 与 预测 值 之 差 ( 即 y — $) , 


多 重 回归 分 析 的 假定 
l e 的 数学 期 望 是 0,， 即 E(e) =0. 这 说 明 y 的 数学 期 望 等 于 模型 的 确定 性 分 量 ， 即 
E(y) =pBo *Bixy e Box, 十 Bi 
2. ATEHERE, x2,…, GWARE, s 的 方差 是 常数 ， 即 V(e,) =o. 
3. 8 的 概率 分 布 是 正 态 分 布 . 
4. 随机 误差 是 独立 的 (在 概率 意义 下 ). 














11.3 拟 合 模型 : 最 小 二 乘法 


拟 合 多 重 回 归 模 型 的 方法 与 拟 合 一 阶 (直线 ) 模型 是 一 样 的 . 因此 ， 我 们 将 使 用 最 小 二 乘 方法 ， 
通过 极 小 化 


SSE = 之 (y; -5)? = > [y - (Êo + Bixa + xp + + Bx) ]2 


来 选择 Bo, By, …, Bi 的 估计 . 如 同 直线 模型 情况 , BUIME SSE BEES GT Âo, Êi, e, 房 ) 可 以 通 
过 解 下 列 线性 方程 组 而 得 . 
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93E -0 655E o, 3SSE _ 
96 98, 98, 
为 了 说 明 方程 组 的 性 质 , 先 检查 第 一 个 方程 . 求 SSE 关于 By 的 偏 导 数 得 
os = 25 [y; — (Êo + Bixa + Baxn + +Ó,xa)] (- 1) 
9Bo 5 
4 0SSE/af, 等 于 0, 得 


0 


Eyi- (nf + Traub + Xxof ++ Exa,) =0 
或 者 
nf, + ( Xxa)yB, + ( xj +-+ xj, = Xyi 
与 简单 线性 回归 的 情况 一 样 , SUE AS Bu, B 9225382. 剩 下 的 个 最 小 二 乘 方程 ,也 都 是 局 ， 
Bi, ，…, 房 的 线性 方程 
Exi), + ( xa^), + ( xitxpz)62 + + ( Xrana)B, = 2 xay; 
( Exo) + ( Exaxn)Ê + ( Era Ê+ E xaxa)b = Xxpy, 


(Ex)po + ( Xxaxaf * Ut *( Exa’ Êi = Zx;yyi 
正如 看 到 的 ， 写 出 (f+1) 个 最 小 二 乘 线性 方程 很 麻烦 ， 用 手 算 求解 方程 组 就 更 困难 . 表示 和 求 
解 方程 组 的 一 个 简单 方法 是 利用 矩阵 代数 ， 但 是 不 可 避免 的 计算 最 好 通过 统计 软件 得 到 . 
在 11.4~11.7 节 ， 用 矩阵 代数 给 出 最 小 二 乘 佑 计 、SSE、 检验 统计 量 、 置 信 区 间 和 预测 区 间 的 公 
式 , 将 通过 简单 的 数字 例子 来 说 明 他 们 的 使 用 . (在 阅读 本 章 的 其 余部 分 之 前 ， 也 许 要 复习 附录 A 中 
的 概念 . ) 在 剩 下 几 节 ， 给 出 几 个 有 用 的 多 重 回归 模型 ， 并 演示 如 何 利 用 SAS、SPSS、MINITAB 和 
EXCEL 软件 的 输出 来 分 析 每 个 模型 . 


11.4 用 矩阵 代数 计算 : 关于 单个 B 参数 的 估计 和 推断 


最 小 二 乘 方程 及 解 
为 了 在 回归 分 析 中 应 用 和 矩阵 代数 ， 必须 将 数据 以 特定 的 方式 放 在 矩阵 中 . 我 们 假定 模型 是 
y=Bo +Bix1 +B2xa 十 … *Bix, + £ 


其 中 1 , xo, … 实 际 上 可 以 是 预测 变量 的 平方 、 立方 、 交叉 乘积 或 其 他 函数 ，s 是 随机 误差 . 假定 已 





经 收集 到 个 数据 点 , 即 n 个 y 和 相应 的 31592, 7n, xy 值 ,将 它们 表示 为 表 11. 1 那样 ， 那么 两 个 数 
HEERE Y AI X Stn T Ei RERS Bras. 
表 11.1 多 重 回归 的 记号 
数 据 点 y f& Xl x Ut X, 不 可 观测 的 随机 误差 
1 y X11 Xi Ut Xu £1 
2 Ya Xy X3 Ut X £2 
n y, Xn X ... xa En 


ÈE X EERKA— IRER, 所 以 插入 一 个 % 的 值 , TUI xo, 作为 po 的 系数 , 其 中 xo 是 总 
等 于 1 的 变量 . 因此 , 对 每 一 个 B 参数 , EER X 中 都 有 一 列 与 之 对 应 . 也 请 记 住 , 一个 特定 的 数据 
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点 由 矩阵 了 和 天 中 的 某 一 行 指出 . 例如 , 数据 点 3 的 y Ë y, 在 矩阵 了 的 第 三 行 , 对 应 的 x ， a, 
x, 值 在 矩阵 于 的 第 三 行 . 利用 这 些 符号 ,一般 线 性 模型 可 以 表示 成 矩阵 形式 为 
Y=X8 += 














数据 矩阵 Y M X, B 矩阵 及 误差 矩阵 
h l xi “xp Xu Ê ^ 
y: l x, 0X X B 2 
Y= 为 | X= 1 xm, Xo Xak Ê = ñ, €£-|£ 
Yn l x, xy cn Kak ñ, e 
矩阵 包含 了 线性 模型 : 


Y =Po +B1%1 t Box, tcc + B,x, +E 


系数 Bo, Bi, oss Bi 的 最 小 二 乘 估计 (是 我 们 试图 得 到 的 ). 
用 数据 矩阵 了 入、 它们 的 转 置 以 及 BB 矩阵 , 可 以 将 最 小 二 乘 方程 写成 如 下 的 最 小 一 乘 矩阵 方程 


最 小 二 乘 和 矩阵 方程 
(X'X)B - X'Y 














Bt, (XX) 是 最 小 二 乘 估计 ,Bl ，,，…, B, 的 系数 矩阵 , XY 是 等 式 右边 的 常数 矩阵 . 
由 附录 A. 39 给 出 的 方程 的 解 是 如 下 的 最 小 二 乘 解 . 


最 小 二 乘 解 
B= (X'x) 'X'Y 








因此 , 为 求解 最 小 二 乘 矩 阵 方程 , HAIA X), (CX) 71, XY, 最 后 , HSGRERAOCX) IXY, R 
们 将 用 10. 2 节 的 绝缘 材料 压缩 量 示例 中 的 数据 来 说 明 这 个 过 程 . 
RK 11.2 中 绝缘 材料 压缩 量 数据 的 最 小 二 乘 直线 ,其 中 内 = 压力 . 
解 ” 模 型 是 
Y =Po +Bixi +E 
Y, X, B FI e 矩阵 为 





X9 Xi AR 11.2 一 种 绝缘 材料 的 压缩 量 和 压力 
1 1 1 El FÉ 品 压力 x, 压缩 量 y 
1 1 1 
A € 
1 1 2 -rÊ 2 2 > 1 
7=|2| X-|1 3 8-[7] =| = 3 3 ; 
2 1 4 ! 24 4 4 2 
4 1 5 £5 5 5 4 





O 用 附录 A.3 中 的 记号 ,4 -X'X, V-B, G-X'Y. 因此 方程 4V=G BUR V -A-1G. 
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则 


1 1 
1 2 
1 1 11 1 5 15 
xx pos a|! luli 55 
1 5 
1 
11110| a0 
3 a sl|2 [ls 
4 


需要 的 最 后 一 个 矩阵 是 (X'X) 7! ,这 个 矩阵 可 以 通过 计算 机 程序 中 的 软件 包 或 用 附录 A. 4 的 方法 得 


到 . 如 此 求 得 
1.1 0.3] 


X'X -1- 
( ) -0.3 0.1 


iig] RTEKA: 


. L1 -0.3} p10} p-0.1 
B-On^xY-[ 6. oi PE 0.7 


因此 , Bo = -0.1, Bj =0.7. 并 且 预 测 方程 为 : 
£= -0.140.7x 
可 以 验证 , 这 与 10.3 节 中 得 到 的 答案 相同 . 
参考 表 11.2 中 的 绝缘 材料 压缩 量 数据 . 另外 ,对 每 个 样品 在 10% 下 测量 压缩 量 (y) . JE 
71 Gc, ) 和 温度 (%;) 的 值 . 数据 列 在 表 11.3 中 . 现在 考虑 两 个 变量 的 多 重 回 归 模 型 
y=Bo +Bix! t Box, +E 
K bo, B, 和 ps 的 最 小 二 乘 估计 . 
f Y, X, B 的 矩阵 如 下 : 


X9 Xi 22 


表 11.3 将 温度 加 入 到 压缩 量 -压力 数据 





1 1 1 1 ñ - 
1 1 22 Po EA EA n E 压缩 量 
Y=|2| X=|1 3 2| =| Á, 2 2 2 1 
2 1 4 4 Ê 3 3 2 2 
2 4 4 4 2 
4 1 5 3 5 5 3 4 
那么 
5 15 12 10 
zx- 55 ° erm 
12 42 34 27 


用 统计 软件 包 , 得 到 
1.325 -0.075 -0. ss 


an= -oo 0.325 -0.375 
-0.375 -0.375 0.625 
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B = (XX) lxX'Y 
1.325 -0.075 -0.375 10 0.35 
=| -0.075 0.325 -0. s "| z 
—-0.375 -0.375 0. 625 27 - 0. 75 
因此 , po 20.35, Bj 21.15, B; = -0.75, 并 且 预 测 方程 为 
了 =0.35 +1. 15a, — 0. 75x, 
回忆 , 矩阵 有 ETHER X) -1 和 矩阵 了 的 乘积 ; 
B=[(X'X) lX']Y 
B f Per 0802632 MKE Âo, Êi, nn, Bi ) 是 通过 矩阵 (X'X) -1X' 的 行 乘 以 矩阵 了 的 列 而 得 到 的 ， 
所 以 , Bo SFERE CXX) -1X' 的 第 一 行 和 和 矩阵 了 的 乘积 ,一 般 地 , B, ETERECA X) -1X' 的 第 (i+ 
DfrRÓBEE Y RER. 因此, 对 i=0, 1, 2,…,k, B; 是 nn 个 正 态 随 机 变量 yi, y», y, 的 线性 函 
数 , 根据 定理 6.7, B, 具有 正 态 抽样 分 布 

Bo» Bi, cs B, 抽样 分 布 的 均值 和 方差 的 推导 超出 了 本 书 的 范围 . 但 是 可 以 证 明 , 最 小 二 乘 估计 


Æ bBo, Bi, Ut, P. 的 无 偏 估计 ， 即 
E(B,) =B;, i=0,1,2,.k 


人 计量 局， B... B, 的 标准 误差 和 协 方差 由 矩阵 (于 'X) -! 中 的 元 素 所 确定 . 因此， 如果 把 条 
PE(X'X) ipf 


Coo Col ` CO, 
ĉio CH ` Cik 

, -1 _ 
(XX) =| co cl co c ca 
CHo “kk 


则 可 以 证 明 ( 证 明 略 ) , Bo, Bi , B, 的 抽样 分 布 的 标准 误差 是 
Gg, =O Coo 
Th, ^O /Cj 


05, OC 


Th, = OV Cg 

其 中 o 是 随机 误差 e 的 标准 差 . 换 句 话说 , EEX) -! 的 对 角 元 素 所 给 出 的 值 co, ch, s cE 

下 面 给 出 最 小 二 乘 估计 抽样 分 布 的 性 质 . 

定理 11. 1(p,(i=0, 1,2, …,k) 的 抽样 分 布 性 质 ) 房 (i=0,1, 2,.…, 上 ) 的 抽样 分 布 是 正 态 分 
布 ， 且 有 

E(B,) -Bi V(B;) = cio? Th, = Mei 

EEX) ”的 非 对 角 元 素 确定 了 Ê, Âs ，…, BL 的 协 方差 .因此 可 以 证 明 ,两 个 参数 估计 量 

B, 和 户 ( 其 中 i 站 的 协 方差 为 : 
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Cov( B; Bj) = cjo? = cjo? 
例如 ， Cov (Êo , B) = coo? 70307 , Cov(p,, B3) 20307 T6507. 这 些 协 方差 对 确定 预测 方程 
7=po *Bixi tByy + +ñ, 

或 者 应 B, ，…, Êr 的 任何 其 他 线性 函数 的 方差 是 必须 的 .它们 在 求 ECy) 置 信 区 间 和 y 的 预测 区 间 
中 也 起 着 重要 的 作用 . 

估计 o° 

可 以 看 到 , 所 有 参数 估计 量 的 方差 和 了 的 方差 都 依赖 于 o 的 值 . 因为 事先 几乎 不 知道 o’, 因 
此 , 必须 用 样本 数据 估计 它 的 值 . 


多 重 回归 模型 中 方差 o? 的 估计 





2 


m SSE 
有 -模型 中 B 参 数 的 个 数 


SSE -Y'Y -B'X'Y 





其 中 








ORBE 求 例 11. 2 中 拟 合 绝缘 材料 压缩 量 数据 的 多 重 回归 模型 的 SSE. 


E 从 例 11.2 中 我 们 有 
0. 35 10 
s- 1. d Z2] 
-0.75 27 


那么 
1 
1 
YY=[1 1 2 2 4]|2!-26 
2 
4 
K 
10 
Ê'X'Y=[0.35 1.15 tas) [es 
27 
所 以 . 
SSE = Y'Y - B'X'Y -26 -25.8 20.2 
最 后 ， 


> SSE 0.2 
ECTE T 5-370] 
这 个 估计 值 对 构造 单个 6 参数 的 置信 区 间 、 检验 它 的 取 值 的 假设 或 对 于 给 定 的 压缩 压力 x 构造 平均 
压缩 量 B(y) 的 置信 区 间 都 是 必须 的 . 
你 不 会 感到 惊讶 , s? 的 抽样 分 布 与 卡 方 分 布 有 关 . 事实 上 , 定理 6.8 和 定理 10 1 是 定理 11 2 的 
特殊 情况 (证 明 省 略 ). 
定理 11.2 ”考虑 线性 模型 





Y7Bo*Bixi Box, +… t Bax, + € 
它 包含 (+1) 个 待 估计 的 未 知 B 参数 . 如 果 11.2 节 中 的 假定 成 立 , 则 统计 量 
2 SSE [n-(k+1)]s? 
=- 


G a? 





X 
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服从 自由 度 为 z=[m-( 有 &+1)] 的 卡 方 分 布 . 
根据 定理 11.2, 我 们 可 以 证 明 s? 是 o? 的 无 偏 估 计 ; 
2 xi o? 
FG e [rA tee] m aen 180 
HB EQ?) 2v2[n- (K91)], 因此 
E(s?) = (FE) o1 2g? 
由 此 得 , s2 是 o? 的 无 偏 估计 . 





关于 单个 8 参数 的 推断 
利用 枢 轴 量 法 和 了 统计 量 
s Jez 


可以 构造 模型 参数 Bi(i=0, 1, 2,…, ) 的 (1 -a)100% 置信 区 间 ( 参 考 本 节 的 理论 练习 ). bs Ios 
是 的 标准 误差 估计 , 将 标准 误差 公式 中 的 o 用 :代替 而 得 到 . 8, 的 置信 区 间 与 7.6 节 给 出 的 总 体 
均值 的 小 样本 置信 区 间 有 相同 的 形式 . 

Bi 的 (1 -a)100% 置 信 区 间 
Ê: + taa (Ê 的 标准 误差 估计 ) 


Pi tuns Yes 





或 者 





其 中 tuz 与 s 有 相同 的 自由 度 . 








类 似 地 , 检验 原 假设 Ho : B, =0 的 检验 统计 量 为 : 
B, - Bi 


T- - 
B; 的 标准 误差 估计 s/c; 














检验 过 程 总 结 在 下 面 的 框 格 中 ， 
多 重 回归 模 型 中 单个 参数 系数 的 检验 
y=pBo +Bix! *Byx, 十 … 十 Bexx +E 
单 侧 检 验 双 侧 检验 
H, : B; =0 H,: B, =0 
H,: B; »0( X B, «0) H,: B, 40 
检验 统计 量 9: EE 
ñ sc 
拒绝 域 : 了 > 如 (或 了 < -1,) 拒绝 域 : | 了 | >z 
其 中 ,n= 观察 的 个 数 ,k= 模型 中 自 变量 的 个 数 ， 且 RA [n-(k«1)] Ei. 
假定 : 关于 随机 误差 e 的 概率 分 布 的 假定 参看 112 Y. 











O 如果 检验 的 原 假设 是 参数 B, 等 于 某 个 不 为 零 的 值 , 形 如 Ho : B; =Bio , 则 用 检验 统计 量 7= (B; - B, )/s8,- 检验 的 所 有 其 他 
方面 都 如 框 格 所 描述 的 . 
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置信 区 间或 检验 都 可 以 用 来 确定 模型 中 的 某 一 项 是 否 能 对 y 的 预测 提供 信息 , 我 们 举例 说 明 . 
参考 例 11. 1 的 直线 模型 , 求 直 线 斜 率 B1 的 估计 量 Bi 抽样 分 布 的 标准 误 估计 . 然后 给 出 
B, 的 95% 置信 区 间 , 并 解释 结果 . 

解 ” 对 例 11. 1 的 最 小 二 乘 解 , REPECX'X) -1 为 : 

(X'X) -1 -| 1.1 =>] 
-0.3 0.1 
因此 ,co =1.1, ca =0.1. X s? 20.367 ( 8848] 10.3 43). 因此 , B, 的 标准 误 估计 是 ， 


s; =s c1 = 0. 367 ( v0.1) =0. 192 





Bi BJ 95% 置信 区 间 是 : 
Bi ti.2s4/ €] 
0.7 € (3.182) (0. 192) = (0.09,1.31) 
T (& to 0zs 的 自由 度 是 (n - 2) 23. 由 此 可 以 看 出 ,这 里 的 置信 区 间 与 例 10.5 中 得 到 的 相同 . 我 们 有 
95% 置信 度 认为 压力 x 每 增加 一 个 单位 , 压缩 量 y 的 增 量 在 0.09 ~ 1. 31 单位 之 间 . 因为 斜率 显著 不 
等 于 0, 所 以 压力 * 是 压缩 量 y 的 有 用 线性 预测 量 . 
参考 例 11.2 和 11.3 中 的 多 重 回归 模型 B(y) = Bo +Bixi +B. 
a. 计算 局 的 标准 误差 估计 . 
b. 计算 检验 Ho: B, =0 对 H, : B, 50 的 检验 统计 量 值 ,陈述 你 的 结论 , 取 w =0.05. 
E 从 例 11.2 PRAEC) lE. 
1.325 -0.075 -0.375 
(XX) -!=| -0.075 0.325 -0.375 
-0.375 -0.375 0. 625 
AC(OC'X) EE: 
coo = 1. 325 
cll =0. 325 
€, = 0. 625 
又 从 例 11.3 PA s? 20.1, 所 以 s= V0.1=0.316. 
a. By 的 标准 误差 估计 是 ; 
n =s,/cn = (0.316) ./0. 625 =0. 25 
b. 由 例 11.2, B, = -0. 75. 所 以 检验 H, : p, =0 的 检验 统计 量 值 是 ， 
B2 -0.75 


B; 
对 双 侧 了 检验 , 如 果 |7| taz, 就 拒绝 Ho 在 这 个 例子 中 , 了 的 自由 度 为 [mn — (A +1)] =5 -3=2. 
因此 , 对 于 a=0.05, 如 果 |7| >4. 303( 见 表 B. 7) , 我 们 将 拒绝 Ho. 因为 了 的 观测 值 了 = -3.0 的 绝 
对 值 没有 超过 4. 303, 没有 充分 的 证 据说 明 B, 0. 因此 , 检验 结果 的 的 实际 含义 是 ， 没有 证 据 指出 
il BE (x, ) 是 模型 的 重要 预测 变量 . . : 


11.5 评价 整体 模型 的 恰当 性 
对 于 包含 很 多 项 的 模型 , 要 对 每 个 B 参数 进行 了 检验 以 确定 模型 是 否 对 y 的 预测 提供 信息 ,并 
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不 是 一 种 好 方法 . 如 果 我 们 进行 一 系列 了 检验 来 确定 自 变量 对 预测 关系 是 否 有 贡献 , 在 决定 哪些 项 
留 在 模型 中 , 娜 些 项 从 模型 中 剔除 时 很 可 能 犯 一 个 或 几 个 错误 . 例如 , 假定 所 有 的 6 参数 (除了 Bo) 
事实 上 都 不 等 于 零 ,尽管 断言 任何 一 个 参数 不 等 于 零 的 概率 仅仅 是 o, 但 在 一 组 了 检验 中 ,至少 一 个 
真实 的 原 假设 被 拒绝 的 概率 会 很 高 . 考虑 下 面 类 似 的 事实 可 以 看 出 为 什么 这 是 真 的 ,抛掷 一 枚 硬币 ， 
观测 到 正面 的 概率 是 0. 5, 但 当 抛掷 5 枚 硬币 时 , 观测 到 至 少 一 次 正面 的 概率 是 0. 97. 因此 , 在 考虑 
包含 大 量 自 变量 的 多 重 回归 模型 时 , 进行 一 系列 的 了 检验 ,可 能 会 有 许多 变量 不 显著 ,从 而 剔除 了 
一 些 有 用 的 变量 . 如 果 我 们 想 检验 多 重 回归 模型 的 整体 恰当 性 ,就 需要 用 全 局 检验 (包含 所 有 p 参数 
的 一 种 检验 ) ,我 们 希望 能 找到 某 个 统计 上 的 量 来 度量 模型 拟 合 数 据 有 多 好 的 程度 . 

我 们 从 更 容易 的 问题 一 一 寻找 多 重 回归 模型 拟 合 一 组 数据 有 多 好 的 度量 开始 . 为 此 , 用 直线 模 
型 (第 10 RERA r 的 多 重 回 归 等 价 物 . 因此 , 我 们 定义 样本 多 重 决定 系数 R? 为 ， 
_ ZF) SSE 

Ey-7)? Sy 

其 中 3 是 模型 中 y; 的 预测 值 . 与 简单 线性 模型 完全 一 样 ,R? 是 样本 统计 量 , CRE y 值 的 样本 变 闫 
(由 SS 度量 ) 中 可 归 因 于 回归 模型 的 贡献 部 分 . 因此 , R = 0 意味 着 模型 对 数据 完全 没有 拟 合 . 
R =1 意 味 着 完美 的 拟 合 , 模型 通过 每 个 数据 点 . 一 般 地 ，R2 的 值 越 大 ， 模型 拟 合 数据 就 越 好 . 

定义 11. 1 多 重 决定 系数 R 定义 为 : 


R2=1 





其 中 SSE = Z (y, -$;)2, SS,, = Y(y; = y), $, £ y, 用 多 重 回归 模型 的 预测 值 . 
考虑 例 11.2, 11.3 和 11. 5 中 关于 绝缘 材料 压缩 量 数据 的 多 重 回归 模型 E(y) = B, + Bixi + 
Bosa, RRAN R, HREN. 

# 从 例 11.3 知 , SSE-0.2. 现在 


SS, = X(y;- y)? = Y? - ( Xyi)'/n -26 - (0) .6 

因此 ， 
UU -22 =0.967 
R° 的 这 个 值 意味 着 在 压缩 量 (y) 的 样本 变 差 中 , 大 约 有 97% 归 因 于 或 由 自 变 量 压力 (xi ) 和 温度 (> ) 
中 的 一 个 或 多 个 来 解释 . 所 以 , R 是 模型 拟 合 数据 有 多 好 的 样本 统计 量 , 因此 它 可 以 作为 整体 模型 
恰当 性 的 一 种 度量 . 

R 是 样本 统计 量 的 事实 说 明 , 对 于 指定 的 自 变量 集 , 它 可 以 用 来 推断 模型 对 预测 y 值 的 统计 效 
用 . 对 于 一 般 的 线性 模型 E(y) =Bo * Bx, +B% ++ *Bix, , 检验 

f Hy: Pi =B, 2 B3 = =B, =0 

H,: 至 少 有 一 个 B 参数 不 等 于 0. 
就 是 检验 整体 模型 的 恰当 性 . 检验 这 个 原 假 设 的 检验 统计 量 为 
、 SS J)/k 
检验 统计 量 ; F - egy = SS EDI 

Kb n ERSE, k 是 模型 中 的 参数 个 数 (不 包括 Bo), SS( 模 型 ) = SS,, - SSE . 在 原 假设 成 立 
下 ,下 检验 统计 量 服 从 分 子 自 由 度 为 大 ,分母 自 由 度 为 [ma- (k+1)] 的 FF 概率 分 布 . F 分 布 的 上 尾 值 


R =1 





406 第 11 章 





由 表 B. 9 ~ B. 12 给 出 . 
可 以 证 明 ( 证 明 略 ), 检验 模型 整体 恰当 性 的 检验 统计 量 的 等 价 形式 是 : 
F- R?/k 
(1-R2)/[n-(k+1)] 
因此 , 随 着 决定 系数 R EK, 下 检验 统计 量 也 会 变 大 . MEEK FEYTE AGER o 可 以 断定 
模型 对 预测 y 有 用 之 前 ,我 们 建立 如 下 拒绝 域 : 
F»F, 





其 中 自由 度 : 
p| =k, V, =n-(k+1) 
这 个 检验 过 程 总 结 在 下 面 的 框 格 中 . 


(全 局 ) FF 检验 的 方差 分 析 : 检验 模型 E( y) =Bo +B, x, tp.x, +… +B ,x, 的 整体 恰当 性 
H, : B, =B, =B, => =B, =0 
H,: $3 B, fau. 至 少 有 一 个 不 等 于 零 . 


R° 7k -模型 的 均 方 SSRÆ)/k 
BAHE: PATE r] a saa Eln OECD] 


拒绝 域 : F> F. ,其 中 v =k fin, =[n-(k+1)] 
BE: 参看 11.2 节 关 于 随机 误差 分 量 e 的 概率 分 布 假定 . 


LEN 参考 例 11. 6 的 多 重 回归 模型 By) =o e Bia, Box, 检验 确定 整体 模型 对 y 预测 是 否 提 
供 信息 , 取 a =0.10. 

解 我 们 想 检验 Ho: B, 2B, =0. 对 本 例 , n=5, k=2 和 nn 一 (k+1) =2. X 0 20.10 Bf, 如 果 
F > F1, 其 中 Vj -2, v, 22, 我 们 拒绝 Ho : Pi =B, =0. 从 附录 查 到 F 的 临界 值 是 Fo 10 =9.0. 因 
此 ,如果 计 算 的 值 F>9.0, 应 拒绝 Ho CURES 11.1). 

从 例 11.6, RITA R =0. 967. 因此 , 检验 统计 量 是 ， 

F- R?/k - 0. 967/2 
(1-R*)/[n-(k*1)] (1-0.967)72 

因为 这 个 值 超过 了 表 中 值 9.0, 我们 得 出 结论 , 模型 系数 pl 和 中 至 少 有 一 个 不 等 于 零 . 因此 F 
检验 说 明 , 整体 多 重 回归 模型 E(y) = Bo +Bixi Box 对 预测 压缩 量 y 是 有 用 的 . 

总 结 迄 今 为 止 的 讨论 , R 的 值 是 预测 方 。 an 
程 拟 合 数据 好 坏 的 一 个 指标 . 更 重要 地 , 它 可 À 
以 用 来 (用 下 统计 量 ) 确 定数 据 是 否 提供 了 足 
够 的 证 据说 明 整体 模型 对 预测 y 贡献 了 信息 . 
然而 , 基于 计算 的 RR 值 对 模型 贡献 的 直觉 判 
断 必须 小 心 ， 随 着 越 来 越 多 的 变量 加 入 到 模型 























=29.0 











H, RP 的 值 会 变 得 越 来 越 大 . 因此 , 可 以 强迫 a =0.10 

R 取 到 一 个 很 接近 于 1 的 值 ,即使 模型 对 y f 
的 预测 没有 贡献 信息 . 事实 上 ， 当 模型 中 的 项 ° fa 90 

数 等 于 数据 点 个 数 时 ，Re 将 等 于 1 一 see 一 一 


HR 作为 模型 恰当 性 度量 的 另外 一 种 ”图 11.1 »-2, n, =2, a =0. 10 时 正统 计量 的 拒绝 域 
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经 常 使 用 的 形式 是 调整 的 多 重 决定 系数 , 记 作 R. RT 的 公式 如 下 : 


调整 的 多 重 决定 系数 
(n-1) /SSE\_ |. n-l 
x Gen ss, n-(k+1) 











R =1- (1- R) 








与 及 AR, Ri 同时 考虑 了 (“调整 为 ") 样本 容量 n 和 模型 中 6 参数 个 数 . Ra 总 比 尼 小 , 而 且 
更 重要 的 是 , 不 可 能 简单 地 向 模型 添加 越 来 越 多 的 自 变量 , 迫使 尼 “ 接 近 于 ”1. 因此 ， 一 些 分 析 人 员 
在 选择 模型 恰当 性 度量 时 ,喜欢 用 比较 保守 的 R. 

从 上 面 的 绝缘 材料 压缩 量 例子 中 ， 


2.41. (n-1) -RY 4 _ 
R =1 nDl R?) =1 > (1 -0.967) =0. 934 


我 们 可 以 保守 地 说 , 在 压缩 量 y 的 样本 变 差 中 , 大 约 有 93% 由 模型 中 的 xj 和 x2 来 解释 . 但 要 记 住 ， 
R 和 RR 仅仅 是 样本 统计 量 ， 不 能 聘 立 地 依赖 他 们 的 值 来 告诉 模型 对 预测 y 是 否 有 用 . 利用 下 检验 
《有 可 靠 性 度量 o 作 支持 ) 对 多 重 回 归 模型 的 整体 恰当 性 作 推断 . 

我 们 给 出 如 何 检查 多 重 回归 模型 的 整体 恰当 性 的 一 些 规则 来 结束 本 节 内 容 . 


检查 多 重 回归 模型 效用 的 一 些 建议 
L 首先 , 用 下 检验 来 检验 整体 模型 的 恰当 性 , 即 检验 
Ho : Bi zc: =B =0 

如 果 认 为 模型 是 恰当 的 ( 即 如 果 拒 绝 H), PERTE ZS. 否则 ， 应 该 假设 和 拟 合 另 外 一 个 模型 ,新 模 

型 可 能 包括 更 多 的 自 变量 或 高 阶 项 
.对 特别 感 兴趣 的 那些 B 参数 ( 即 那些 “最 重要 的 ”8 项 ) 进 行 检验 ,通常 是 那些 仅仅 与 高 阶 项 (x? ,xix, 等 ) 关 联 的 B 

参数 ,但 是 限制 被 检验 的 有 参数 个 数 是 安全 的 惯例 ,进行 一 系列 的 了 检验 导致 “个 较 大 的 整体 1 型 错误 概率 a. 
3. 检查 RR 和 2s 的 值 ， 从 数值 上 评价 模型 拟 合 数据 有 多 好 . 





N 














11.6 E(Y) 的 置信 区 间 和 未 来 值 y 的 预测 区 间 


E( y) 的 置信 区 间 
我 们 假定 公司 生产 能 力 y 的 平均 值 与 公司 规模 大 小 x 有 关 , 这 个 关系 可 以 用 表达 式 
E(y) 2 Bo +Bix + Box? 

来 建 模 , E(y) 的 图 像 可 能 如 图 11. 2 所 示 . 

可 以 有 几 个 理由 来 收集 nn 家 公司 的 规模 和 生产 能 力 数据 , 求 得 最 小 二 乘 预测 方程 为 ， 

5 - Bo * Bx * By 
例如 , 对 于 一 家 给 定 规模 (如 x=2) 的 公司 ， 要 估计 这 家 公司 的 平均 生产 能 力 , 即 想 估计 
E(y) =Bo +Bix +62% =Bo «28, +46， (其 中 x =2) 

或 者 我 们 要 估计 生产 能 力 的 边际 增 量 , 曲线 在 x =2 的 切线 斜率 ( 见 图 11.3). ` x =2 BF, y 的 边际 生 
产能 力 是 E(y) ET x 的 变化 率 在 * =2 的 估 值 . x 值 的 边际 生产 能 力 用 符号 dE(y)vdx 表示 对 于 二 次 
RAHO. 





O 注意 : 对 给 定 的 *, y 的 边际 生产 能 力 是 E(y) =B Bux +B 关于 的 一 阶 偏 导 数 . 
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i) ) =; +2B2x 


因此 ,在 *=2 的 边际 生产 能 力 是 ; 
SAI =B, +26 (2) =B; +48, 














E(y) E(y) 
i i 
R R 
gg æ | 
ra ke ! 
3B H i 
i £ I 
里 + i 
L. X L i — 
公司 x-2 
AN 司 规模 公司 规模 
图 11.2 平均 生产 能 力 E(y) 的 图 图 11.3 边际 生产 能 力 


注意 : 对 x =2， E(y) 和 边际 生产 能 力 都 是 模型 中 未 知 参数 Bo ， Bis Bz 的 线性 函数 . 我 们 在 本 节 
提出 的 问题 是 : 寻找 B 参数 的 线性 函数 的 置信 区 间 ， REAREA KREEK. MERE X)! 
可 以 找到 这 些 置信 区 间或 适当 的 检验 统计 量 的 值 . 

假定 我 们 有 模型 : 

y-Bo *Bixi t + Bux + 8 
我 们 感 兴趣 的 是 关于 B 参数 的 线性 函数 作 推 断 ， 例 如 ; 
aoo + a,B +… * a4, 
FP ao, a, e, a, 是 已 知 常数 . 进一步， 我 们 将 利用 最 小 二 乘 估计 的 相应 线性 函数 ， 
€ = aofo * aif, + * ai, 
作为 aoBo + a B, 十 … t au, 的 最 好 估计 . 
回忆 11.4 节 , 最 小 二 乘 估计 量 Âo, Âi …, ñ, 服从 正 态 分 布 , 有 
E(B.) - p, 
V(B;) - cuo? (i20,1,2,--.,k) 
和 协 方差 
Cov(; Bi) - cya? (ij) 
因此 根据 定理 6.9, 
€ =aopo t aif t + a4, 
也 服从 正 态 分 布 , 均值 、 方 差 和 标准 差 由 定理 11.3 给 出 . 
定理 11.3(《 =aofo + ai 房 +… + aÓ, 的 抽样 分 布 性 质 ) 《 的 抽样 分 布 是 正 态 分 布 , 具有 
E(€) 2 aoBg * a B, * aj, 
V(4) = [a'(X'X) -la]o2 
ce 7 V V(£) »oa'(X'X) la 
其 中 0 是 & 的 标准 差 ， (X'X) COLO ROI s 1: z EE, HE 
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RE) 


定理 11.3 指出 , € E 
£ 


E(£) = aoBo t aif Tc t au, BO - 2o; EG E( 26, 


的 无 偏 估 计 , 且 它 的 抽样 分 布 如 图 11.4 所 示 . 
因此 , EOC -a)100% 置信 区 间 如 下 : 图 11.4 € 的 抽样 分 布 


E(0) B) (1 -a)100% 置 信 区 间 


€ (1,,)s Va (X'X) ^a 








其 中 
E(€) =aoBo cai, +… +a,B, 
€ = aĝo +a ñ, tn + af, 
Go 
a, 
a= G, 
a, 








SSOCX) ”由 最 小 二 乘 过 程 中 得 到 , 与 s* 有 相同 的 自由 度 . 
我 们 最 关注 的 通常 是 6 参数 的 线性 函数 : 
E(y) =Bo *Bix + + Bix, 
x, 的 值 , 我 们 想 找 出 EO) 的 置信 区 间 . 对 《 = 了 这 种 特殊 情况 , 矩阵 ea 是 : 
1 





对 指定 的 Xis X2, 7 


Xk 


其 中 矩阵 a 中 的 符号 x , x2 ，…, 是 这 些 变量 所 取 的 数值 . 因此 , 建立 E(y) 的 (1 - a)100% 置信 区 





间 方 法 如 下 : 
E( y) Ë) (1 -a)100% 置信 区 间 
了 + (to)s Va (XX) ^a 
其 中 


E(y) =B, +B,x, ++ +B,x, 


$ 2 By +B,x, tB a=| x, 


x, 





SROUX) "8 Z 8 24482], 1,5 s ABB B BE, Win- (k+1)]. 
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ER 参考 例 11.2 和 11.5 中 的 数据 和 绝缘 材料 压缩 量 y 的 多 重 回归 模型 E(y) = Bo im + 
Baxa. REH xı =5( 即 50 Ib/in? ) 和 温度 x =3( 即 30% ) 时 , 平均 压缩 量 E ( y) 的 95% 置信 区 间 . 
解 ” 对 于 给 定 的 x 值 , E(y) 的 置信 区 间 是 
Ftans va (X'X) la 
从 而 , 需要 计算 并 将 a (XX) la, tan, s 和 7 的 值 代入 公式 中 .因为 要 估计 : 
E(y) =Bo * Bixi +B>x; =Bo +B1(5) * B2(3) =Bo * 5B1 * 3E; 
RB x25, x; =3, 所 以 Bo, B, 和 的 系数 分 别 是 oo 71, a; =5 和 az 23, 因此 ， 


E 


AJ 11.2 380 11.5, 我 们 有 了 =0.35 +1. 15x; -0.75x4, 52 20.1, 520.316 和 
1.325 -0.075 -0.375 
(X'X) -1 | -0.075 0.325 -0. s 
-0.375 -0.375 0.625 


所 以 
1.325 -0.075 -0.375T1 
a'(X'X) la=[1 5 s - 0. 075 0. 325 EUH 
-0.375 -0.375 0. 625 J- 3 
我 们 先 计算 
. 1.325 -0.075 -0.375 
a'(X'X) !=[1 5 a| - 0.075 0.325 -0.375 
-0.375 -0.375 0. 625 
=[ -0.175 0.425  -0.375] 
所 以 


1 
a'(X'X) la=[ -0.175 0.425 -0. ms [en 825 
3 
具有 2 个 自由 度 的 了 值 io.0zs 是 4.303. 所 以 , 当 受 到 压力 x, =5 和 温度 > =3 BF, 绝缘 材料 的 平均 压 


缩 量 的 95% 置信 区 间 是 ， 
Ftans va (X'X) la 
因为 了 =0.35 +1. 15x, -0. 75x, 20.35 +1.15(5) -0.75(3) =3. 85, 所 以 , Ey) BJ 95% 置信 区 间 是 
3. 85 + (4. 303) (0. 316) v0. 825 23.85 + 1. 24 = (2. 61,5. 09) 

即 我 们 有 95% 置信 对 受到 50 Ib/in?(x, 25) 压力 和 30% (x, =3) 温 度 的 所 有 材料 , 平均 压缩 量 E( y) 
在 2.61 ~5.09 in 之 间 . 

未 来 y 值 的 预测 区 间 

对 于 xi. 32. 0. xy 的 指定 值 ,可 能 不 想 估计 y 的 均值 天 (y) ， 而 希望 预测 还 没有 观察 到 的 新 7 
E, 这 两 种 推断 问题 ( 当 每 个 都 恰当 时 ) 之 间 的 差异 在 第 10 章 中 已 有 解释 . 但 是 我 们 将 给 出 另外 一 
个 例子 , 说 明 在 这 点 上 二 者 的 区 别 是 明显 的 . 

假设 某 个 制造 三 的 管理 者 , 每 日 利润 y 是 各 种 过 程 变量 x, e, o, x, 的 函数 . 假定 想 知道 , 对 
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于 给 定 的 一 组 x 值 , 经 长 期 运行 以 后 能 够 赚 到 多 少 钱 . 对 于 这 种 情况 , 感 兴趣 的 是 每 天 平均 收益 
E(y) 的 置信 区 间 . 与 此 不 同 的 是 , 假定 你 计划 开 一 个 仅仅 运行 几 天 的 工厂 ! 那么 感 兴趣 的 可 能 是 与 
明天 产量 关联 的 利润 y 的 预测 值 . 

我 们 已 经 指出 , 预测 量 的 误差 总 是 比 估计 ECy) 的 误差 大 . 比较 下 面 框 格 给 出 的 预测 区 间 和 前 面 
给 出 的 ECy) 的 置信 区 间 公式 ,就 可 以 看 到 这 一 点 . 


y f (1 -a)100% 预 测 区 间 
了 + (ta)s V1 +a (X'X) "a 





其 中 A À 
£=B, +B,x, +… +B,x, 
sf (X'X) 由 最 小 二 乘 分 析 得 到 ， 


(E xxv. w 的 数值 , to 与 有 相间 的 自由 度 , EB[n - (k+1)]. 











和 有一 参 考 绝缘 材料 压缩 量 例子 ( 例 11.8). 当 压 力 为 50 Ib/in? (x, 95) , REA 30C (x, =3) 
时 , 求 一 块 绝缘 材料 压缩 量 的 95% 预测 区 间 . 
解 ”这 块 绝缘 材料 压缩 量 的 95% 预测 区 间 是 : 


y +t(tun)s v1 +a (XX) la 
由 例 11.8, 34x, =5, x, 23 时, $23.85, 570.316, toos =4.303, a'(X'X) “la = 0. 825， 所 以 y 的 
95% 预测 区 间 是 : 

3.85 + (4. 303) (0. 316) V1 +0. 825 

3.85 +1. 84 = (2. 01 ,5. 69) 
因此 , 我 们 有 95% 置信 对 一 块 受到 50 lb/in? (x, 25) EH, 30% (x, =3) 温 度 的 绝缘 材料 ， 压缩 量 y 
介 于 2.01 ~5.69 in 之 间 . 


应 用 练习 f. 3k À, 的 标准 误差 
11.1 3€ K 48 n MS 69 Ap. 参考 练习 10.7, The g. 给 出 并 解释 B, 89 90% 置信 区 间 . 

American Ceramic Society Bulletin(2005 年 2 月 ) 关 于 h. 给 出 并 解释 玉 值 . 

熔 铝 霸 塌 的 研究 . 熔 铝 圭 塌 的 寿命 依赖 于 砖 衬 的 孔 i. 给 出 并 解释 当 x=10 时 , y 的 90% 预测 区 间 . 
RE, 6 个 样品 砖 的 表 观 孔隙 率 及 每 块 砖 的 平均 孔 Fe ” 表 观 孔隙 率 (%)，,y 平均 孔径 (pm) , x 
径 复制 在 附 表 中 , 用 最 小 二 乘法 对 6 个 数据 点 拟 合 A 18.8 12.0 
线性 模型 E(y) = By * B,x. B 18.3 9.7 

C 
D 
E 
F 





a、 对 此 数据 构造 了 和 互 矩 阵 . 16.3 7.3 
b. ok X'X #l X"Y. E i 
c 验证 : 20.4 16.8 
(XX)? -[ 1.50384 —0. 12940 f 

—0.12940 0.012523 

d. 求 B 矩阵, 然后 给 出 最 小 二 乘 预 测 方程 . 
e. 求 SSE Hi š. 


资料 来 源 : Bonadia, P. , et al. “ Aluminosilicate refractories 
for aluminum cell linings. ” The American, Ceramic Society Bul- 


letin, Vol.84, No.2, Feb. 2005( E IL). 
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11.2 药品 控制 释放 速度 研究 . 参考 练习 10.22, 
Drug Development and Industrial Pharmacy (Vol 28 , 
2002. ) 关 于 在 控制 释放 剂量 中 , 药物 的 释放 速度 
研究 . 测量 6 片 药 的 表面 积 与 体积 的 比 和 渗 滤 释放 
速度 (药物 释放 的 百分比 除 以 时 间 的 平方 根 ) ,实验 
数据 复制 在 表 中 . 用 最 小 二 乘法 对 6 个 数据 点 拟 合 
线性 模型 E(y) = B, +B,x. 





药物 释放 速度 7 表面 积 与 体积 之 比 x 
(多 释放 / Y 时 间 ) (mm? /mm ) 
60 1. 50 
48 1.05 
39 0.90 
33 0.75 
30 0. 60 
29 0. 65 


———  . _ 
资料 来 源 : Reynolds, T. , Mitchell, s. , and Balwinski, k. 
“Investigation of the effect of tablet surface area/ volume on 


drug release from Hydroxypropylmethylcellulose controlled — 


release matrix tablets. " Drug Development and Industrial Phar- . 


macy, Vol, 28, No.4, 2002 (f 3). 
.对 此 数据 构造 Y 和 于 矩阵 . 


b. R X'X &0 XY. 

U. 1.64772. 1.63052 

e. MEI) -=| -1.63052 1. 79506 |` 

- GR B 矩阵 ,然后 给 出 最 小 二 乘 预测 方程 . 

. 3K SSE fi š. 

GR B, 的 标准 误差 

. 用 a=0.05 检验 已 : B, =0 X} H, : B, #0. 

. 给 出 并 解释 RC 值 . 

. 给 出 并 解释 当 x =1 BF, E(y) BJ 95% 预测 区 间 . 

11.3 后 辆 拥塞 研究 . 参考 练习 10.6, Journal of En- 

gineering for Industry 关于 在 自动 化 仓库 中 车 辆 拥塞 

的 研究 ， 车辆 数 (x) 和 拥塞 时 间 (y) 的 数据 复制 在 

RH, 考虑 直线 模型 EF(y) =p, *Bix. 

a. 对 此 数据 构造 了 和 互 和 矩阵 . 

x X'X 8 X'Y. 

c 求 最 小 二 乘 估计 司 = (X'X) X' Y (k, 计算 
(X'X) “的 信息 参见 定理 A. 1. ) 

. R SSE HI s’. 

. 用 a=0.01 进行 检验 到: Bı =0 X} H, : B, >0. 
计算 并 解释 R. 

. 计算 并 解释 当 x=5 时, y 的 99% 预测 区 间 . 


m 


”~ m mm => e gc 


= 


m moa 


车 辆 数 % 拥塞 时 间 y(min，% ) 





O 0-10 € à Q Ñ — 


"RO R 58 k NN GO O R 8 — 5 C ° 


资料 来 源 : Pandit, R. , and U. S. Palekat, “ Response time 
considerations for optimal wherehouse layout design. " Journal 
of Engineering for Industry, Transactions of the ASME, Vol. 
115, Aug. 1993 ,p.326(3€ 2). 


11.4 铸 块 的 性 质 . 进行 一 项 研究 检查 单 向 凝固 铸 块 


中 铸造 组 织 和 等 轴 晶 的 机 械 性 质 之 间 的 关系 (Met- 
allurgical Transactions, 1986 年 5 月 ). 将 由 铝 、 铜 和 
铁合金 (等 轴 结 构 ) 组 成 的 铸 液 倒 人 模子 ， 并 用 水 
进行 冷却 直到 凝固 为 止 . 对 每 个 铸 块 ， 在 距离 铸 块 
冷 模 表面 的 不 同位 置 得 到 5 个 样品 的 张力 ， 且 确定 
每 个 样品 的 晶 粒 大 小 ( 即 晶 粒 数 ) ,一 块 这 种 铸 块 的 
数据 在 下 表 中 给 出 . 假定 感 兴趣 的 是 拟 合 二 次 
模型 ; 
Y7Bo *Bix +B,x° + 8 
其 中 : 
y = ñi KU 
x= 到 冷 模 表面 的 距离 
a. 对 此 数据 构造 了 和 无 和 矩阵 . 
b. o& X'X M X"Y. 
c. 用 附录 A. 4 中 介绍 的 方法 , RX)? (保证 计 
算 结果 到 6 位 有 效 数字 ). 
- 求 语 矩阵 和 最 小 二 乘 预测 方程 
求 SSE Al s’. 
. Ja 20.05 检验 本 : B, =0 XE H, : B, =0. 
- Fl a =0. 05 对 模型 的 整体 恰当 性 进行 检验 . 
.计算 并 解释 RC. 
计算 并 解释 当 %=7.5 BF, E (y) 的 95% 置信 
区 间 . 


== mm = e = 
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到 冷 模 表 面 的 距离 x( em) 唱 粒 大 小 y( mm) 
1.0 0.24 
3.5 0.38 
6. 0 0.44 
8.5 . 0. 61 


11.0 0. 75 
资料 来 源 : Kato, H. , and Cahoon, J. R. “Tensile properties 
of directionally solidified A1-4 wt pet Cu alloys with columnar 
and equiaxed grains. " Metallurgical Transactions. Vol. 17A, 
No. 5, May 1986, p. 830 页 ( 表 2). 

11.5 液体 的 光 密 度 . EROR SUMI, BI PPFPO 
是 一 种 粘性 液体 , 作为 滑润 剂 广泛 地 应 用 于 电子 工 
业 . Applied Spectroscopy(1986 年 1 H ) 的 一 份 研究 报告 
考察 了 PPFPO 的 红外 线 反射 谱 性 质 ,在 铂金 埃 尔 型 
621 红外 线 分 光 仪 中 , 对 不 同 波段 频率 (x, ) 和 胶片 厚 
JE (a, ) 的 实验 设置 , 记录 PPFPO 的 主要 红外 线 吸收 
的 光 密 度 (y) ,结果 在 表格 中 给 出 . 





AGERE y 波段 频率 x1(cm-') 胶片 厚度 x, (mm) 
0.231 740 1.1 
0. 107 740 0.62 
0.053 740 0.31 
0.129 805 1.1 
0. 069 805 0. 62 
0. 030 805 0.31 
1. 005 980 1.1 
0. 559 980 0. 62 
0. 321 980 0.31 
2.948 1235 1.1 
1. 633 1235 0.62 
0. 934 1235 0.31 





资料 来 源 : Pacansky, J., England, C. D. ，and Waltman, 
R. “ Infrared spectroscopic studies of poly ( perfluoropropyle- 
neoxide) on gold substrates: A classical dispersion analysis for 
the refractive index. " Applied Spectroscopy, Vol. 40, No. 1, 
Jan. 1986, p.9 i (3€ 1). 


考虑 一 阶 模型 ; 
E(y) =pBo t Bx, + Bx, 
a. 对 此 数据 构造 了 和 于 矩阵 . 
b. R X'X #fl X". 
c. 用 附录 A.4 介绍 的 方法 , SR (XX) 7 CIE E 
结果 到 6 位 有 效 数字 ). 
d. 求 8 矩阵 和 最 小 二 乘 预测 方程 . 
Rs, 并 解释 它 的 值 . 
. 计算 并 解释 RO. 
. 用 =0. 10 对 整体 模型 的 恰当 性 进行 检验 . 
. 找 出 并 解释 B, 的 90% 置信 区 间 . 
. 找 出 并 解释 B, 的 90% 置信 区 间 . 


m mm m o 


j 计算 并 解释 当 x, 2950, x, 20.62 时 , y 的 90% 
预测 区 间 . 


11.6 空闲 土 地 的 分 区 制 .“ 分 区 制 ” 是 当地 政府 通 


过 政策 制定 的 住宅 和 非 住宅 使 用 的 空闲 土地 的 分 
Bo. 虽然 对 分 区 制 的 副作用 进行 了 研究 (例如 , Ë 
乱 城市 的 房地产 市 场 , 对 住宅 的 流动 性 增加 障碍 ， 
妨碍 经 济 与 社会 的 整合 ) , 但 几乎 没有 经 验证 据 指 
出 限制 鼓励 实行 分 区 制 的 因素 . Journal of Urban 
Economics (Vol.21, 1987) 报告 了 一 项 研究 ， 对 假 
设 的 几 个 分 区 决定 因素 , 建立 一 系列 多 重 回归 模 
型 , 研究 的 模型 之 一 有 形式 ，; 
E(y) =B; * Bux, * Box? *Byx, 

其 中 : 

Y= 住宅 使 用 的 空地 地 区 的 百分比 

= 现 有 土地 在 非 住 宅 使 用 中 的 百分比 

x, = 来 自 非 住宅 地 产 占 总 税收 比例 
选择 新 泽 西 州 东北 郊 n = 185 个 城市 社区 的 数据 拟 
合 模型 ,结果 如 下 : 

HER 参数 估计 估计 的 标准 误 if pË 





截 距 92. 26 3. 07 30.05 p«0.01 
3, -96. 35 46. 59 -2.07 p«0.05 
xi 166. 80 120. 88 138 p>0.10 
X); — -75.51 13. 35 -5.66 p<0.01 


调整 的 R=0.25 F-21.86(p«0.01) 
资料 来 源 : Rolleston, B.S. “Determinants of restrictive sub- 
urban zoning; An empirical analysis. " Journal of Urban Eco- 
nomics, Vol.21, 1987, p. 15 Wt, X4. 


a. 构造 B; BJ 95% 置信 区 间 , 并 解释 结果 . 

b. 检验 假设 : 住宅 使 用 的 空地 地 区 的 百分比 (y) 与 
现 有 土地 在 非 住 宅 使 用 中 的 百分比 (x ) 之 间 存 
在 曲线 关系 . 

c. 整体 模型 对 预测 y 在 统计 上 有 帮助 吗 ? 

d. 解释 调整 的 尼 值 . 


11.7 最 佳 化 学 催化 剂 的 选择 . 联合 碳化 物 公 司 进 


行 一 项 研究 , 确定 在 乙 胺 醇 ( MEA ) 转化 为 乙 二 胺 
(EDA 用 于 肥皂 中 的 一 种 物质 ) 时 , 最 佳 催化 剂 的 
备 制 条 件 . 对 事先 选择 的 10 种 催化 剂 , 测量 下 列 
实验 变量 的 值 : 

y - MEA 到 EDA 的 转化 率 

= 实验 中 使 用 的 金属 原子 比 

x, = 减少 温度 

x. = N 如 果 使 用 高 酸性 载体 

° lo, 如 果 使 用 低 酸性 载体 - 
用 ”=10 个 实验 数据 拟 合 多 重 回归 模型 E(y) = 
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Bo +Bix! +B,x, + Byzs. 结果 总 结 在 下 表 中 : 
$=40.2 -0.808x, -6. 38x, -4. 45x; R? =0. 899 


35, =0. 231 58, 21.93 Shs =0. 99 


资料 来 源 : Hansen, J. L. , and Best, D. C. ^ How to Pick a 
Winner. " Papre presented at Joint Statistical Meetings, Ameri- 
can Statistical Association and Biometric Society, Aug. 1986, 
Chicago, Illinois. 


a. 有 充分 的 证 据说 明 模型 对 预测 转化 率 y 有 效 吗 ? 
用 a =0.01 检验 . 
b. 用 a = 0. 05 进行 检验 确定 原子 比 x, 是 转化 率 y 
的 有 用 预测 量 吗 ? 
c. 构造 B, 的 95% 置信 区 间 , 并 解释 这 个 区 间 . 
11.8 大 型 计算 机 的 CPU. 因为 当 一 个 新 的 自 变量 添 
加 到 模型 时 , 决定 系数 RE 总 是 递增 的 ,这 引诱 人 
们 在 模型 中 包含 很 多 自 变量 使 得 R: 接近 于 1. 然 
而 , 这 样 做 会 减少 用 于 估计 o^ 的 自由 度 ， 它 反 过 
来 又 影响 我 们 进行 可 靠 推断 的 能 力 . 作为 一 例子 ， 
假定 要 用 18 个 预测 变量 (例如 任务 的 大 小 .递交 的 
时 间 和 估计 的 打印 行 ) 来 预测 大 型 计算 机 工作 的 
CPU 时 间 , 拟 合 模型 
Y By *Bin + yx, Bax +E 
其 中 y = CPU 时 间 ,% ,x,，…, xwis 是 预测 变量 . 用 
n= 20 个 任务 的 相关 信息 拟 合 模 型 , 得 到 m = 
0.95. 通过 检验 确定 ， 为 了 推断 这 个 模型 是 有 用 
的 ， 即 模型 中 至 少 有 一 -项 对 预测 CPU 时 间 是 重要 
的 , 这 个 R 值 是 否 足够 大 . 用 a = 0. 05 检验 . 


理论 练习 
11.9 如果 11.2 节 中 的 假定 满足 , 可 以 证 明 5 55 g, 
的 最 小 二 乘 估 计 B, 独立 . 利用 这 个 事实 及 定理 


11.7 定量 预测 量 的 一 阶 模型 


11.1 和 11.2, 证 明 ， 


Ren 


; - Bi 

s Ja 
服从 自由 度 为 [n - (k +1) J HEE T 4i. 

11.10 用 练习 11.9 给 出 的 了 统计 量 ， 并 结合 枢 轴 
法 , 导出 p; 的 (1 - a)100% 置信 区 间 的 公式 . 

11. 11 HA Ê, Ê, US B. 5s 相互 独立 ， 所 以 

£7 asl, +ap tea, 

与 独立 . 利用 这 个 事实 及 定理 11.2 和 11.3, 
证 明 : 


T= 





£ - E(€) 

s /a'(X'X) la 
服从 自由 度 为 [n - (k 1) ]8932F T 43398. 

11.12 H6-y-À Bos ys, + Bux. 用 练习 
11.11 中 的 7 了 统计 晤 ,并 结合 枢 轴 法 , 推导 EC) B8 
(1 -a)100% 置信 区 间 的 公式 . 

11.13 R=, +Âx es + le, 是 最 小 二 乘 
顶 测 方程 , y 是 未 来 的 某 个 观测 值 . 

a. 解释 为 什么 (了 -y) 服 从 正 态 分 布 . 
b. WEHR: 

~ EK($-y) =0 
V($-y) 2[1*a'(X'X) "lale. 

证 明 : . 

T=— y 
s V1 +a'(X'X) a 
服从 自由 度 为 [n - (k +1) ] 的 学 生 了 分 布 . 

11.15. 用 练习 11. 14 的 结果 和 枢 轴 法 , 推导 y 的 

(1-a) 100% 预测 区 间 公 式 . 


T= 


11. 14 





RE, 已 经 介绍 了 多 重 回归 的 基本 概念 和 公式 . 我 们 将 演示 几 个 常用 的 实际 多 重 回归 模型 的 完 
整 分 析 . 本 节 考 虑 仅 含有 定量 自 变 量 项 的 一 阶 模型 注意 , 一 阶 模型 不 包括 任何 高 阶 项 ( 如 x1?) , 术 


语 一 阶 是 由 于 模型 中 的 每 个 x 都 是 一 次 宕 的 事实 ， 





含有 5 个 定量 自 变 量 的 一 阶 模型 
E(y) =P, *Bixy t Box, + Bux, * Bax, +Bsxs 


其 中 ,x， Xa, t5, 





s 都 是 定量 变量 ， 不 是 其 他 自 变量 的 函数 . 


È: B 表示 当 所 有 其 他 x 国定 时 ， 联 系 y 与 x; 的 直线 斜率 . 





回忆 直线 模型 (第 10 章 ) 


Y =Po *Bix +£ 
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Bo 表示 直线 的 y RE, B, 表示 直线 的 斜率 . 从 第 10 章 的 讨论 可 知 , B, 有 实际 解释 , 即 它 表 示 x 每 增加 1 
个 单位 y 的 平均 变化 . 当 自 变量 是 定量 变量 时 ， 上 面 指定 的 一 阶 模型 的 6 参数 有 类 似 的 解释 . 不 同 的 是 ， 
当 解 释 与 一 个 指定 变量 (如 x ) 相 乘 的 那个 6 时 , 必须 保证 固定 其 他 自 变量 (如 x,, x, 等 ) 的 值 . 

为 了 说 明 这 一 点 , 假定 响应 y 的 均值 E(y) 与 两 个 定量 自 变量 x1 ,xs 有 关 , 用 一 阶 模型 表示 为 . 

E(y) -1 十 2X1 x) 
换 句 话说 , Bo =1, B -2, B, = 1. 
HE, 4 x, -0, E(y) S x, 的 关系 由 下 面 的 式 子 给 出 ; 
E(y)=1 +2x; +(0) =1 +2x| 
这 个 关系 图 (一 条 直线 ) 如 图 11.5 所 示 . 类 似 地 , M <, =1 时 ， 
E(y) =1 +2x +(1) =2+2xi x72 
M x, =2 Bf, %51 
E(y) =1 +2x) + (2) =3 +2x, e= 0 
E(y) 5j x, 的 这 些 关系 也 在 图 11.5 中 给 出 . 注意 , 三 条 直线 的 
斜率 都 等 于 乘 子 z 的 系数 B =2. 

图 11.5 刻画 了 所 有 一 阶 模型 的 特征 : 如 果 想 画 E(y) 关于 
任意 一 个 变量 (如 x ) 的 图 像 , 对 其 他 变量 的 固定 值 , 结果 都 是 
斜率 等 于 B, 的 直线 . 如 果 对 其 他 固定 自 变量 的 值 重 复 这 个 过 | F O, 
程 , 将 得 到 一 组 平行 直线 . 这 说 明 , 自 变量 z, 对 有 (7) 的 影响 与 1 2 3 | 
模型 中 所 有 其 他 的 自 变量 无 关 , 用 斜率 B, 度量 这 种 效果 . 图 11.5 x =0, 1,2 时 , E(y) = 

一 阶 模型 是 实践 中 过 到 的 最 基本 的 多 重 回归 模型 . 1 +2x, + x, 的 图 像 
| 例 11. 10 | 考虑 一 个 生产 过 程 , 其 中 有 一 个 或 多 个 工人 从 事 各 种 不 同 的 工作 ,在 这 个 过 程 , 生产 的 
总 花费 时 间 是 工作 池 的 规模 和 不 同 活动 产 出 水 平 的 函数 .在 一 个 大 型 百货 公司 ,文员 的 每 天 工作 时 
间 依 赖 于 下 面 的 变量 ; 


< 


C — Ñ ho - oo 





x, = 处 理 的 邮件 数 ( 打开, 分 类 等 ) 
x, = 销售 的 礼券 数 
zs = 公司 内 账 交易 数 
x, = 交易 订单 改变 或 退回 数 
xs = 兑现 支票 数 
52 个 工作 日 的 样本 数据 列 在 表 11. 4 中 . 公司 的 产品 工程 师 想 用 一 阶 模型 
E(y) =Bo +Bix1 +B>x> Bass +Baxa +Bsxs 





对 工作 的 小 时 数 进行 建 模 . 
表 11.4 文员 工作 量 的 日 数据 
观测 工作 日 y X, X X3 X4 Xs X6 x7 
1 M 128.5 7781 100 886 235 644 56 737 
2 T 113.6 7004 110 962 388 589 57 1029 
3 w 146.6 7267 61 1342 398 1081 59 830 
4 Th 124.3 2129 102 1153 457 891 57 1468 
5 F 100.4 4878 45 803 577 537 49 335 
6 S 119.2 3999 144 1127 345 563 64 918 
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观测 工作 日 y X, X) x3 X4 Xs X6 37 
7 M 109. 5 11 777 123 627 326 402 60 335 
8 T 128.5 5764 78 748 161 495 57 962 
9 wW 131.2 7392 172 876 219 823 62 665 
10 Th 112.2 8100 126 685 287 555 86 577 
11 F 95.4 4736 115 436 235 456 38 214 
12 S 124. 6 4337 110 899 127 573 73 484 
13 M 103. 7 3079 96 570 180 428 59 456 
14 T 103.6 7273 51 826 118 463 53 907 
15 W 133.2 4091 116 1060 206 961 67 951 
16 Th 111.4 3390 70 957 284 745 77 1446 
17 F 97.7 6319 58 559 220 539 41 440 
18 S 132.1 7447 83 1050 174 553 63 1133 
19 M 135.9 7100 80 568 124 428 55 456 
20 T 131.3 8035 115 709 174 498 78 968 
21 W 150. 4 5579 83 568 223 683 79 660 
22 Th 124. 9 4338 78 900 115 556 84 555 
23 F 97.0 6895 18 442 118 479 41 203 
24 S 114.1 3629 133 644 155 505 57 781 
25 M 88.3 5149 92 389 124 405 59 236 
26 T 117.6 5241 110 612 222 477 55 616 
27 w 128.2 2917 69 1057 378 970 80 1210 
28 Th 138.8 4390 70 974 195 1027 81 1452 
29 F 109. 5 4957 24 783 358 893 51 616 
30 S 118.9 7099 130 1419 374 600 62 957 
31 M 122.2 7337 128 1137 238 461 51 968 
32 T 142.8 8301 115 946 191 771 74 719 
33 W 133.9 4889 86 730 214 513 69 489 
34 Th 100. 2 6308 81 461 132 430 49 341 
35 F 116.8 6908 145 864 164 549 57 902 
36 S 97.3 5345 116 604 127 360 48 126 
37 M 98.0 6994 59 714 107 473 53 726 
38 T 136.5 6781 78 917 171 805 74 1100 
39 w 111.7 3142 106 809 335 702 70 1721 
40 Th 98.6 5738 27 546 126 455 52 502 
41 F 116.2 4931 174 891 129 481 71 737 
42 S 108. 9 6501 69 643 129 334 47 473 
43 M 120.6 5678 94 828 107 384 52 1083 
44 T 131.8 4619 100 7T] 164 834 67 841 
45 w 112.4 1832 124 626 158 571 71 627 
46 Th 92.5 5445 52 432 121 458 42 313 
47 F 120.0 4123 84 432 153 544 42 654 
48 S 112.2 5884 89 1061 100 391 31 280 

49 M 113.0 5505 45 562 84 444 36 814 
50 T 138.7 2882 94 601 139 799 44 907 
51 w 122.1 2395 89 637 201 747 30 1666 
32 Th 86.6 6847 14 810 230 547 40 614 


FP RÆ: Adapted from Smith, G. L. Work Measurement. Columbus, OH; Grid Publishing Co. , 1978( 3€ 3. 1) 
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a. 加 出 样本 数据 的 散 点 图 , 并 解释 这 个 图 . 

b. 用 最 小 二 乘法 估计 模型 参数 ,并 解释 B 估计 值 . 

c. 求 随机 误差 项 的 标准 差 e 的 估计 , 并 解释 这 个 值 . 

d. 通过 在 a =0. 05 的 假设 检验 评价 模型 的 恰当 性 . 

e. 求 B 的 95% BAKE, 并 解释 这 个 结果 . 

f 求 调整 的 决定 系数 R, 解释 这 个 结果 . 

g. 当 处 理 的 邮件 数 xı =5 000, 售 出 的 礼券 数 xç =75 ,公司 几 账 交易 数 x =900, 交易 订单 改变 
或 退回 数 x, =200, 兑现 支票 数 xs =650 时 , 求 一 天 工作 小 时 数 的 95% 项 测 区 间 , 并 解释 这 个 结果 . 

AR a 检查 因 变量 y 与 5 个 自 变量 中 的 每 个 自 变量 关系 的 MINITAB 散 点 图 如 图 11.6 所 示 . 在 5 
个 变量 中 ,兑现 支票 数 (xs ) 与 y 呈现 出 最 强 的 线性 关系 ， 而 处 理 的 邮件 数 (xi ) 55 y 具有 最 弱 的 线性 
关系 . 


Y-Hours 





图 11.6 3€ 11. 3 数据 的 MINITAB 散 点 图 


b. 我 们 用 SAS 对 数据 拟 合 模型 , 拟 合 结果 的 SAS 输出 如 图 11.7 所 示 . 根据 B 参数 的 最 小 二 乘 估 

计 ( 在 输出 中 着 重 显示 ) 得 到 下 面 的 预测 方程 ， 
7=66.3 +0. 0012x, +0. 116x +0. 013x4 - 0. 045x, +0. 056xs 

我 们 知道 , 对 于 一 阶 模型 , 8; 表示 当 模 型 中 的 其 他 x 值 不 变 时 , y 5j x; 直线 关系 的 斜率 . BIB, 度量 当 
模型 中 所 有 其 他 自 变量 的 值 保 持 不 变 时 ， x; 每 增加 一 个 单位 E(y) 的 改变 量 . 因此 , 我 们 得 到 下 面 的 
解释 : 

Bi =0.0012: 当 模型 中 其 他 yx 值 保持 固定 时 , 每 多 处 理 一 个 邮件 ( 即 x, 每 增加 一 个 单位 ), 我 们 
估计 平均 每 天 工作 时 数 E(y) 增 加 0.0012 h. 
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The REG Procedure 
Model: MODEL! 
Dependent Variable: HOURS 
Number of Observations Head 52 
Number of Observations Used 52 
finalysis of Variance 
Sum of Mean 
Source DF Squares Square F Value Pr > 上 
Model 5 8576.40174 1315.28035 10.55 «.0001 
Error 46 5736.11057 124.69806 
Corrected Total 51 12313 
Root MSE 11.16683 R-Square 0.5341 
Dependent Mean 117.37692 fidj R-Sq 0.4835 
Coeff V 9.51365 
Parameter Estimates 
Parameter Standard 
Variable DF Estimate Error t Value Pr > iti 957 Confidence Limits 
Intercept 1 66.26431 9.10141 7.28 <.0001 47 . 94472 84.58510 
MAIL 1 0.00124 0.00088788 1.40 0.1686 -0.00054543 0.00303 
GIFTS 1 0.11581 0.04608 2.51 0.0155 0.02305 0.20856 
CHARGE 1 0.01269 0.00871 1.46 0.1520 -0.00484 0.03021 
RETURNS 1 70.04549 0.01755 -2.59 0.0128 -0.08082 -0.01016 
CHECKS 1 0.05616 0.01096 5.12 <.0001 0.03410 0.07822 








图 11.7 工作 时 数 的 一 阶 模型 的 SAS 回归 结果 


3, 20. 116; 当 模 型 中 其 他 * 值 保持 固定 时 , 每 多 售 出 一 张 礼券 ( 即 x, 每 增加 一 个 单位 ) , 我 们 估 
计 平 均 每 天 工作 时 数 E(y) 增 加 0. 116 h. 

3, =0. 013 : 当 模 型 中 其 他 x 值 保持 固定 时 , 每 增加 的 内 账 交 易 ( 即 x3 每 增加 一 个 单位 ) , 我 们 估 
计 平 均 每 天 工作 时 数 E( y) ESJjiil 0. 013 h. 

B, = -0.045: 当 模 型 中 其 他 x 值 保持 固定 时 , 每 改变 订单 交易 ( 即 每 增加 一 个 单位 ) , 我 们 估 
计 平 均 每 天 工作 时 数 E(y) 减 少 0.045 h. 

Bs =0. 056: 当 模 型 中 其 他 x 值 保持 固定 时 , 每 个 增加 的 兑现 支票 数 ( BD xs 每 增加 一 个 单位 ) , 我 
们 估计 平均 每 天 工作 时 数 E( y) Jim 0. 056 h. 

在 这 个 例子 中 , [li B, =66.3 没有 明确 的 意义 解释 . 为 了 说 明 这 个 , 注意 当 z =x, = xs = xa =x 20 
t, =Â, 因此 , =66.3 表示 当 所 有 自 变量 的 值 都 等 于 0 时 , 估计 的 一 天 平均 工作 时 数 . 因为 在 一 个 
工作 日 里 , 没有 邮件 处 理 、 没 有 礼券 销售 、 没 有 内 账 交易 或 改变 订单 交易 的 实施 , 也 没有 支票 兑现 , y 
截 距 的 估计 值 的 解释 没有 意义 . 一般 地 , B, 没有 实际 的 意义 ,除非 对 所 有 值 同 时 为 0 时 它 有 意义 . 

c. o 的 估计 , 在 输出 中 着 重 显示 为 ROOT MSE 是 * = 11. 17. 估计 的 标准 差 s 的 一 个 有 用 解释 是 ， 
区 间 +2s 提供 了 准确 度 的 一 个 粗略 近似 , 模型 将 以 这 个 准确 度 预测 y 的 未 来 值 . 我 们 的 理由 如 下 : 如 
果 11.2 节 中 关于 随机 误差 = 的 假定 成 立 , H| e 服从 均值 为 0、 标准 差 为 o HESSA, 因此 , KA 
有 95% 的 预测 误差 将 落 在 0 的 2o 区 间 之 内 . 或 等 价 地 , AXE y 的 95% 将 落 在 它们 相应 预测 值 的 
2c 区间 内 . 因此 , 我 们 期 望 一 阶 模型 为 工作 时 数 提供 的 预测 落 在 它们 真实 值 的 大 约 + 2s = 
+2(11.17) = +22. 34 区 间 内 . 
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d. 为 了 对 这 个 含有 5 个 自 变 量 的 一 阶 模型 进行 整体 模型 恰当 性 检验 . 我 们 检验 ; 
Ho: Bı 2 B; =B; - B4 =Bs =0 
H,: 上 述 6 中 至 少 有 一 个 不 等 于 0 

检验 统计 量 =10.55, 在 图 11.7 中 着 重 显 示 , 检验 的 观测 显著 性 水 平 p 值 <0. 0001. 因为 这 个 
了 值 小 于 a=0.05, 我 们 拒绝 ,认为 模型 参数 中 至 少 有 一 个 是 非 零 的 , 即 认 为 , 这 个 一 阶 模型 对 预 
测 每 天 的 工作 时 数 y 是 统计 有 用 的 . 

e. B, 的 95% 置信 区 间 是 (0. 023, 0. 209) , 在 SAS 输出 中 相应 于 变量 x; (GIFTS) 行 着 重 显 示 . 我 
们 的 解释 与 b 中 给 出 的 类 似 , 我 们 有 95% 和 置信 每 增加 销售 一 张 礼券 ， 每 天 工作 时 数 的 增加 量 在 
0. 023 ~0. 209 h 之 间 . 

f 调整 的 决定 系数 是 R: =0. 4835, 在 图 11.7 中 着 重 显示 . 这 意味 着 ， 通过 调整 样本 容量 和 模型 
中 所 包含 的 项 ,一 阶 模型 解释 了 每 天 工作 时 数 (y) 的 样本 变 差 中 大 约 48%, 

g. 我 们 用 MINITAB 得 到 想 求 的 y 未 来 值 的 95% 预测 区 间 . 对 于 指定 的 * 值 及 预测 区 间 (97. 09 , 
142. 88) 如 图 11. 8 中 阴影 部 分 所 示 . 我 们 有 95% 置信 当 处理 的 邮件 数 =5 000, 销售 的 礼券 数 x, = 
75 ,公司 肉 账 交易 数 xs =900, 改变 订单 交易 数 x4 =200, 兑现 的 支票 数 xs = 650 时 , 一 天 的 工作 时 数 
将 在 97 ~142 h Z BJ. 











Predicted Values for New Observations |] 
New 
Obs Fit SE Fit 954 CI 95s PI 
1 119.98 2.17 (115.62, 124.35) (97.09, i142:85j 
Values of Predictors for New Observations 
New 
Obs Xi-Mail JX2-Gifts X3-Charge X4-Rerutns X5-Chsoks. 
1 SDD ^. 510 ` 900 ， (8 aD wl 








图 11.8 用 工作 时 数 的 一 阶 模型 预测 y 的 MINITAB 预测 区 间 


尽管 例 LL. 10 中 的 模型 对 预测 y 是 统计 有 用 的 ( 即 全 局 下 检验 是 显著 的 ) , 但 也 未 必 是 实际 有 用 
HJ. 在 每 天 工作 时 数 y 的 样本 变 差 中 ,仅仅 有 大 约 48% 的 变 差 可 以 被 模型 解释 , 模型 的 标准 差 说明 ， 
我 们 预测 的 y 的 误差 在 22 h 内 , 这 个 值 可 能 导致 比 希 望 的 预测 误差 大 . 因此 ， 在 实际 应 用 之 前 , 我 们 
可 能 要 改进 模型 . 在 下 面 的 两 节 中 , 考虑 一 些 比 -一 阶 模型 更 复杂 的 多 重 回归 模型 


11.16 高速 公 路 碰撞 数据 分 析 . 蒙 大 拿 州立 大 学 的 0 下 光村 年 每 日 的 交通 量 (机动 车辆 数 ) , 结 





土木 工程 师 写 了 一 篇 关于 用 经 验 贝 叶 斯 方法 分 析 0 果 如 下 表 所 示 . 

高 速 公路 碰撞 之 前 和 之 后 的 数据 的 指导 (Montana 州 际 公路 

Depariment of Transportion, Research Report，2004 年 E E ”参数 估计 标准 误 T 
5 H). 方法 的 第 一 步 是 建立 一 个 安全 行为 函数 截 距 1.81231 0.505 68 3.58 
《SPE) 一 一 估计 在 给 定 公路 段 上 碰 搜 发 生 的 数学 模 KÆ) 0.10875 0.03166 3.44 
型 . 利用 超过 100 个 高 速 公路 段 收集 到 的 数据 , T AADT(x,) 0.00017 0.00003 5.19 


程 师 拟 合 模型 E( y) =Bo tB +B,x, , 其 中 y= 每 
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非 州 际 公路 8-TCDD 化 学 污染 的 研究 . 用 多 重 回 归 分 析 建 立 联 
E E ”参数 估计 ”标准 误 T (E 系 工人 的 TCDD JE Cy, 万 亿 分 之 一 ) 与 4 个 自 变 
一 量 的 模型 ; 
UE 1.207 85 0.28075 4.30 EO) -B, Bis +B +B, + B.n, 
长 度 (x1) 0.06343 0.01809 3.51 其 中 ， 
AADT(x,) 0.00056 0.00012 4. 86 ox, = 暴露 在 TCDD 的 年 数 的 对 数 





a. 给 出 州 际 公路 模型 的 最 小 二 乘 预测 方程 . 
b. 给 出 a 中 有 估计 值 的 实际 解释 . 


c. 根据 a, 求 8, 的 99% 置信 区 间 , 并 解释 这 个 


结果 . 


d. 根据 a, R e, 的 99% 置信 区 间 , 并 解释 这 个 


结果 . 
e. 对 于 非 州 际 公 路 模型 , 重复 a ~ d. 


11.17 全 球 变 暖 和 外 来 投资 . 科学 家 认为 全 球 变 暖 
的 主要 原因 是 大 气 中 二 氧化 碳 的 含量 较 高 . 在 
Journal of World-Systems Research (2003 ^E) , 社会 


学 家 考察 了 n = 66 个 发 展 中 国家 外 来 投资 对 CO, 


排放 量 的 影响 . 特别 地 ,基于 16 年 前 的 外 来 投资 
及 其 他 自 变 量 , 研究 者 建立 了 1996 年 的 CO, 排放 


量 的 模型 , 变量 和 模型 的 结果 列 在 下 面 的 表 中 . 

a. 解释 R° 的 值 . 

b. 用 a=0.01 对 模型 的 整体 恰当 性 进行 检验 . 

c. 通过 检验 确定 农产品 (xs ) 对 CO, 排放 量 的 预测 
是 否 统计 有 用 ? 取 a=0.01. 

7=In(1996 年 CO, 排放 量 ) pg 估计 TI pË 





xı = ]n(1980 年 的 外 来 投资 额 ) 0.79 2.52 «0.05 


x, = 1980 年 国内 总 投资 0.01 0.13 >0.10 

x4 = 1980 年 的 贸易 出 口 量 -0.02 -1.66 >0.10 

x4 = 1n(1980 年 的 GNP) -0.44 -0.97 50.10 

xs = 1980 年 的 农产品 量 -0.03 -0.66 >0.10 
1, 如 果 是 非洲 国家 

xç = -1.19 -1.52 0. 10 

š f 如 果 不 是 ? 


x -Àn(1980 年 的 CO, 排放 量 ) — 0.56 3.35 — «0.001 
Rê -0.31 


——— —— _ _ C 
资料 来 源 : Grimes, P., and Kentor, J. “ Exporting the 


greenhouse: Foreign capital penetration and CO, emissions 
1980 — 1996. " Journal of World-Systems Research , Vol. IX, 
No. 2, Summer 2003( 3 1). 


11.18 40 — EX ES. 参考 练习 6. 65 Chemosphere 
(1990) X 103 个 生产 工人 暴露 在 二 恶 英 2,3,7, 


x, = 自 最 后 一 次 暴露 的 年 数 
a, = 年 龄 (年 ) 
Xa = 身体 质量 指标 


多 重 回 归 分 析 的 结果 总 结 在 附 表 中 , 全面 解释 这 
些 结果 . 


————————— ÉL 
自 变量 ”参数 估计 估计 的 标准 误 、 7 值 p 值 





截 距 1.721 0.770 2.24 — 
x 0. 566 0. 054 10.48 «0.001 
EA - 0. 085 0.018 -4.72 «0.001 
x; 0. 044 0. 010 4.40 «0.001 
X4 0. 075 0. 021 3.57 «0.001 
R? =0. 742 


一- 


11.19 日 本 甲虫 的 生长 . 在 Journal of Insect Behavior 


(2001 年 11 月 ) 中 , 东 伊 利 诺 州 大 学 的 生物 学 家 公 

布 了 他 们 关于 日 本 甲虫 的 研究 结果 ,生物 学 家 收集 

了 黄豆 地 里 n 213 个 夏天 期 间 的 甲虫 . 作为 研究 的 

一 部 分 , 生物 学 家 建立 了 雌性 甲虫 的 平均 大 小 

y (mm) 作为 日 平均 温度 x, CC ) 和 儒 略 日 期 x 的 函 

数 模型 . 

a. 写 出 E(y)fE29 x, x, 函数 的 一 阶 模型 . 

b. 用 模型 拟 合 数据 ， 得 到 下 面 结果 . 解释 B 的 
估计 . 








Z E 参数 估计 7 值 p Ë 
截 距 6. 51 26.0 <0. 0001 
温度 (x ) -0. 002 -0.72 0.49 
日 期 (x,) -0.010 -3.30 0. 008 


c. 通过 检验 确定 随 着 温度 的 增加 , MEE H 3 rg 
平均 大 小 是 否 线性 递减 ? 取 a =0. 05. 


11.20 地 下 水 中 的 砷 . 参考 练习 7. 53. Environmental 


Science & Technology( 2005 年 1 HOS M F gk pm 
的 商用 设备 的 可 靠 性 研究 . 回忆 用 来 检验 孟加拉 
328 个 地 下 水 样本 野外 设备 , BRT BRKE (mg/L), 
还 测量 了 每 口 井 的 纬度 、 经 度 和 深度 (m) ,数据 保 
存在 文件 ASWELLS rh. 
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(前 5 器 并 和 后 5 口 井 数据 如 下 . ) 
井 纬度 经 度 深度 sh 





10 23.7887 | 90.6522 60 331 
14 23.7886 90. 6523 45 302 
30 23.7880 90. 6517 45 193 
59 23.7893 90. 6525 125 232 
85 23.7920 90. 6140 150 19 
7353 23. 7949 90. 6515 40 48 
7357 23.7955 90.6515 30 172 
7890 23.7658 90. 6312 60 175 
7893 23.7656 90. 6315 45 624 
7970 23.7644 90.6303 30 254 
— _ 一 一 O n SS 


a. 写 出 砷 水 平 (y) 作 为 纬度 、 经 度 和 深度 函数 的 一 
阶 模型 . 

b. 以 最 小 二 乘法 用 模型 拟 合 数据 . 

e. 给 出 B 估计 值 的 实际 解释 . 

d. 求 模型 的 标准 差 ;, 并 解释 它 的 值 . 

11.21 燃气 轮机 的 冷却 方法 . 参考 练习 8.17, Jour- 

nal of Engineering for Gas Turbines and Power (2005 

年 1 月 ) 对 燃气 涡轮 发 动机 的 高 压 注 雾 研究 . 回想 

对 67 台 燃 气 轮机 样本 中 的 每 一 台 测 量 采用 高 压 注 

雾 增 加 的 热 消 耗 率 (kJ/AkW - h), 另外 也 测量 了 几 

个 其 他 变量 , 包括 转速 ( 转 /每 分 钟 )、 注 人 温度 

(已 )、 排 出 气温 (Y )、 转 速 压 力 比 和 空气 质量 流 

量 比 (kg/s) ,数据 保存 在 文件 GASTURBINE rh. 

(前 5 个 和 后 5 个 燃气 轮机 数据 如 下 . ) 








转速 O 空气 热 消 
转速 压力 比 注 人 温度 排出 气温 流量 比 ” 耗 率 
27245 9.2 1134 602 7 14622 
14000 12.2 950 446 15 13196 
17384 14.8 1149 537 20 11948 
11085 11.8 1024 478 27 11289 
14045 13.2 1149 553 29 11964 
18910 — 14.0 1066 532 8 12766 
3600 35.0 1288 448 152 8714 
3600 20.0 1160 456 84 9469 
16000 10.6 1232 560 14 11948 
14600 12.4 1077 536 20 12414 


资料 来 源 : Bhargava, R., and Meher-Homji, C. B. “ Para- 
metric analysis of existing gas turbines with inlet evaporative 
and overspray fogging. " Journal of Engineering for Gas Tur- 
bines and Power, Vol. 127, No. 1, Jan. 2005. 


a. 写 出 热 消 耗 率 (y) 作 为 转速 、 注 人 温度 、 排 出 气 
温 、 转速 压力 比 和 空气 流量 比 函 数 的 一 阶 模型 . 

b. 以 最 小 二 乘法 用 模型 拟 合 数 据 . 

c. 给 出 B 估计 值 的 实际 解释 . 

d. 求 模型 的 标准 差 , 并 解释 它 的 值 . 


11.22 田纳西 河中 的 鱼 污染 . 考虑 位 于 亚 拉巴 马 州 


田纳西 河 边 化 工厂 的 有 毒 排放 物 对 鱼 污 染 的 美国 
陆军 工程 兵团 数据 . 回想 工程 师 们 测量 了 捕捉 到 的 
144 条 鱼 的 身长 (cm)、 体 重 (g) 和 DDT 水 平 ( 百 万 
分 之 一 ), 另外 还 记录 了 从 河 到 上 游 的 英里 数 , 数 
据 保 存在 文件 DDT 中 . (前 5 个 和 后 5 个 观测 如 下 
表 所 示 . ) 








河流 ”英里 种 类 身长 体重 DDT 
FC 5  CHANNELCATFISH 42.5 732 10.00 
FC 5 CHANNELCATFISH 44.0 795 16.00 
FC 5 CHANNELCATFISH 41,5 547 23.00 
FC 5 CHANNELCATFISH 39.0 465 21.00 
FC 5 


CHANNELCATFISH 50.5 1252 50.00 


TR 345 LARGEMOUTHBASS 23.5 358 2.00 
TR 345 LARGEMOUTHBASS 30.0 856 2.20 
TR 345 LARGEMOUTHBASS 29.0 793 7.40 
TR 345 LARGEMOUTHBASS 17.5 173 0.35 
TR 345 LARGEMOUTHBASS 36.0 1433 1.90 


a、 对 数据 拟 合 一 阶 模型 E(y) =B, * Byx, + Bx, + 
B,x,, 其 中 y=DDT KE, x, = 英里 , x, = 身长 ， 
x, = 体重 ,报告 最 小 二 乘 预测 方程 . 

. 求 模型 中 e 的 标准 差 估计 , 给 出 这 个 值 的 实际 
解释 . 

c. 数据 是 否 提 供 了 充分 的 证 据 , 说 明 当 身长 增加 
BF, DDT 水 平 增加 ? 报告 检验 的 观察 显著 性 水 
平 , 用 a=0.05 EHER. 

. RA 的 95% 置 信 区 间 , 并 解释 . 

. Hl a= 20.05 检验 模型 的 整体 恰当 性 . 

f. 以 95% 置信, 预测 在 上 游 100 mile 处 捕捉 到 的 

一 条 身长 40 cm, 体重 800 g 的 鱼 的 DDT 水 平 . 
解释 这 个 结果 . 


= 


£g 


e 


11.28 从 油 中 分 离 水 . 在 石油 工业 中 , 必须 把 生产 


和 运输 期 间 混合 在 石油 中 的 水 去 掉 , 化 学 家 已 经 发 
现 , 电气 方法 可 以 从 水 油 混合 物 中 抽取 石油 . s 
根 (挪威 ) 大 学 的 研究 者 进行 了 一 系列 试验 , 研究 
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影响 从 油 中 分 离 水 要 求 的 电压 (7y) 的 因素 (Journal 
of Colloid and Interface Science, 1995 年 8 H). 研究 
中 调查 的 7 个 自 变 量 列 在 下 表 中 . (每 个 自 变 量 分 
别 在 两 种 水 平一 一 “ 低 ” 水 平和 “高 ”水 平 测 量 ). 在 


自 变 量 的 不 同 组 合 下 , 备 制 了 16 种 水 油 混合 物 ， 
然后 将 乳 状 液 暴露 在 高 电磁 场 中 . 另外 ， 当 所 有 的 
自 变 量 都 设置 为 0 时 , 实验 了 3 种 混合 物 . 19 个 实 
验 数据 在 下 表 中 给 出 . 








实验 编号 电压 y ”扩散 期 体积 ” 含 盐 量 @, 温度 x，。 ”时 间 延 迟 x, 表面 活性 剂 跨度 : 气 核 MEET < 
(kw/cm) xy (96) (96) (©) (h) 浓度 xs (96) X (46) 
1 0. 64 40 1 4 0.25 2 0.25 0.5 
2 0.80 80 1 4 0. 25 4 0.25 2 
3 3.20 40 4 4 0.25 4 0.75 0.5 
4 0.48 80 4 4 0.25 2 0.75 2 
5 1.72 40 1 23 0.25 4 0.75 2 
6 0.32 80 l 23 0.25 2 0.75 0.5 
7 0.64 40 4 23 0.25 2 0.25 2 
8 0. 68 80 4 23 0.25 4 0.25 0.5 
9 0.12 40 1 4 24 2 0.75 2 
10 0. 88 80 1 4 24 4 0.75 0.5 
11 2.32 40 4 4 24 4 0.25 2 
12 0.40 80 4 4 24 2 0.25 0.5 
13 1.04 40 l 23 24 4 0.25 0.5 
14 0.12 80 1 23 24 2 0.25 2 
15 1.28 40 4 23 24 2 0.75 0.5 
16 0.72 80 4 23 24 4 0.75 2 
17 1.08 0 0 0 0 0 0 0 
18 1.08 0 0 0 0 0 0 
19 1.04 0 0 0 0 0 0 0 


- 
资料 来 源 : Fordedal, H. , et al. “A mutivariate analysis of W/O emulsions in high external electric fields as studied by means of dielec- 
tric time domain spectroscopy. " Journal of Colloid and Interface Science, Vol. 173 ; No.2, Aug. 1995, p. 398( 3€ 2). 


， 对 y 作为 所 有 7 个 自 变量 的 函数 建立 一 阶 模型 . 
- 用 统计 软件 包 对 表 中 的 数据 拟 合 模型 . 
完全 地 解释 B 估计 . 

.进行 下 检验 评价 模型 的 恰当 性 , 解释 R 2s. 

. 考虑 模型 E( y) = p, +B +B% + Bux... 研究 者 
认为 “为 了 用 最 低 的 可 能 电压 来 分 离 油水 混合 
物 , 扩散 期 体积 比例 (x ) 应 该 高 ， 而 含 盐 量 
《xz ) 和 表面 活性 剂 浓度 (xs ) 应 该 低 . ”根据 这 个 

信息 求 这 个 “ 低 ” 电 压 y 的 95% 预测 区 间 ，, 并 解 
释 这 个 区 间 . 

11.24 类 星体 的 外 层 空间 调查 . 类 星体 是 提供 无 线 
电 传递 能 量 强 大 源泉 的 远 距离 天 体 ( 至 少 40 亿 光 
年 远 ). The Astronomical Journal (1995 年 7 月 ) 报 告 
了 通过 外 层 空间 调查 发 现 90 个 类 星体 的 研究 . 这 个 
调查 使 天 文学 家 能 够 测量 每 个 类 星体 的 一些 不 同 的 


° Pb m= p 


定量 特征 ,包括 红 移 范围 、 线 电 通 量 (erg/cm? . s), 

线 光 度 (erg/s) , ABus 大小、 绝对 星 等 、 静 止 框 架 

等 效 宽度 ,25 个 大 ( 红 移 ) 类 星体 的 样本 数据 保存 

在 文件 QUASAR 中 .( 几 个 类 星体 的 数据 列 在 下 表 

m.) 

a. 为 等 效 宽度 y 作为 表 中 前 4 个 变量 的 函数 建立 
一 阶 模型 . 

- 对 数据 拟 合 一 阶 模型 ,给 出 最 小 二 乘 预 测 方 程 . 

.解释 模型 中 的 B 估计 值 . 

- 用 = =0. 05 检验 模型 的 整体 恰当 性 . 

. Hio 20.05 检验 确定 红 移 (x, ) 对 等 效 宽度 (y) 
的 线性 预测 是 否 有 用 . 

f. 对 文件 QUASAR 中 的 第 一 个 类 星体 , 求 它 的 等 
效 宽度 (y) 的 95% 预测 区 间 , 并 解释 . 


oO a o c 
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(前 5 个 类 星体 的 数据 ) 
KEK 红 移 (%) AMER) 线 光度 (4) — 0 99 绝对 星 等 静止 框架 等 效 宽度 

X4 (xs) (y) 
1 2.81 — 13. 48 45. 29 19. 50 —26.27 117 
2 3.07 —13. 73 45. 13 19.65 — 26. 26 82 
3 3. 45 一 13. 87 45.11 18. 93 —27.17 33 
4 3.19 -13.27 45. 63 18. 59 一 27. 39 92 
5 3.07 —13. 56 45. 30 19. 59 —26. 32 114 


资料 来 源 : Schmidt, M. , Schneider D. P. , and Gunn, J. E. "Specttroscopic CCD surveys for quasars at large redshift. " The Astro- 
nomical Journal, Vol.110,No. 1, July 1995, p.70( 3E 1). 


11.8 定量 预测 量 的 交互 作用 模型 


f£ 11.7 节 , 用 实例 说 明了 一 阶 模型 中 E(y) 和 自 变 量 之 间 的 关系 . 当 E(y) 关 于 任意 一 个 变量 
(如 xi) 作 图 且 固 定 其 他 变量 的 值 时 ， 结果 是 一 组 平行 直线 ( 见 图 11.5). 当 这 种 情况 发 生 时 (因为 对 
一 阶 模型 总 是 这 样 ), 我 们 说 E(y) 和 任何 一 个 自 变量 的 关系 不 依赖 于 模型 中 其 他 自 变 量 的 值 . 

然而 , 如 果 事实 上 E(y) 和 xi; 的 关系 依赖 其 他 y w=1 
x 的 辕 定 值 时 , 则 一 阶 模型 对 预测 y 是 不 合适 的 . 在 n=? kas 
这 种 情况 下 ,需要 另外 一 种 能 够 考虑 这 种 相关 性 的 
模型 , 这 种 模型 包括 两 个 或 多 个 * 的 交叉 乘积 . 

例如 , 假定 响应 y 的 均值 E(y) 与 两 个 定量 自 恋 
E, a AE, 模型 为 ; 

E(y) =1 +2x) ~ x; +x|X2 | oa 
Xx, 20, 1, 2, E(y) Rl x, 的 关系 图 如 图 11.9 所 1 2 3 
TN. 注意 , 这 里 的 图 像 显示 了 3 条 不 平行 的 直线 . 可 图 11.9 当 =0, 1， 2 时 , 1+2x -x xe, 的 图 像 
以 验证 , 当 把 x, =0, 1, 2 的 每 个 值 代入 方程 时 ， 直线 的 斜率 是 不 同 的 . 当 x。=0， 
E(y) 21 +2x1 ~ (0) +x1(0)=1 *2x, (斜率 =2) 





O =e N G A tA 


H r =1: 
E(y) =1 +2% -(1) +x, (1) =3x (斜率 =3) 
M x, 2; 


E(y) 21 *2a, - (2) +%1(2) = -1+4x! (斜率 =4) 
注意 到 每 条 直线 的 斜率 由 B, +B3x, =2 ex, 来 表示 . 因此 ,现在 x, 的 改变 对 E(y) 的 影响 ( 即 斜率 ) 依 赖 
Tx, 的 值 . 当 这 种 情况 发 生 时 , 我 们 说 SU x, 有 交互 作用 . 交叉 乘积 项 xix, 称 为 交互 作用 项 , 模型 
E(y) =o * Bix, * Bx; t Bax x, 称 为 两 个 定量 变量 的 交互 作用 模型 . 


联系 Ey) 与 两 个 定量 自 变量 的 交互 作用 模型 
E(y) =B, * Bx, * Box, +B% x 
其 中 ,(B +Bsxz ) 表 示 当 xj 固定 , xi 每 增加 一 个 单位 时 E) NARE: (B - Bos ) E 3x, 固定 , x, 每 增加 
一 个 单位 时 EE(y) 的 改变 量 . f 

















用 生产 设备 完成 一 项 工作 所 需 工 时 的 准确 估计 对 管理 者 是 非常 关键 的 , 锅 身 制造 商 想 用 
加 归 分 析 预 测 未 来 工程 中 锅炉 安装 所 需要 的 工时 . 为 了 完成 这 个 任务 , 收集 了 35 个 锅炉 的 样品 数 
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据 . 除了 工时 (y), 测量 的 变量 是 锅炉 的 容积 xı (klb/h) 和 锅炉 设计 压强 x, (lb/in?) ,数据 列 在 表 
11.5 中 . 制造 商 认为 , 对 于 设计 的 高 压 锅炉 ， 随 着 锅炉 容积 的 增加 , 工时 的 增加 速度 会 更 大 . 因此 ， 
提出 下 面 的 交互 作用 模型 ; 

E(y) =B * Byxy +B>x> +B3xlxo 
用 SPSS 对 数据 拟 合 模型 ，SPSS 的 输出 如 图 11. 10 所 示 . 


A115 锅 身 的 研究 数据 
工时 y 锅炉 容积 (klb/h)x， ”设计 压强 (lb/in?)x, | 工时 y ”锅炉 容积 (IIb/h)% 设计 压强 (lb/in? )x, 








3 137 120.0 375 14 791 1 089.5 2 170 
3 590 65.0 750 2 680 125.0 750 
4 526 150.0 500 2 974 120. 0 375 
10 825 1073.8 2 170 1 965 65.0 750 
4 023 150.0 325 2 566 150.0 500 
7 606 610. 0 1 500 1 515 150.0 250 
3 748 88.2 399 2 000 150. 0 500 
2972 88.2 399 2 735 150.0 325 
3 163 88.2 399 3 698 610. 0 1 500 
4 065 90.0 1 140 2 635 90.0 1 140 
2 048 30.0 325 1 206 30.0 325 
6 500 441.0 410 3 775 441.0 410 
5 651 441. 0 410 3 120 441.0 410 
6 565 441.0 410 4 206 441.0 410 
6 387 441.0 410 4 006 441.0 410 
6 454 627.0 1525 3 728 627.0 1 525 
6 928 610. 0 1 500 3211 610. 0 1 500 
4 268 150. 0 500 1 200 30.0 325 





资料 来 源 : Kelly Uscategui, former graduate student, University of South Florida. 


a. Ha 20.05 ffs FRE, 检验 模型 的 整体 恰当 性 . 
b. Æ a =0.05 检验 假设 : 随 设计 压强 (% ) 的 增加 , 工时 (7y) 和 锅炉 容积 (x ) 之 间 关 系 的 斜率 也 
增加 , 即 容积 和 压强 有 正 的 交互 作用 . 
c. 估计 当 锅炉 容积 (zi ) 为 750 klb/h, 设计 压强 每 增加 1 lb/in? 时 , 工时 (y) 的 改变 量 . 
解 a 全 局 政 检验 是 用 来 检验 原 假 设 
Hy: Bı 28; =B3=0 
检验 统计 量 和 检验 的 p 值 分 别 是 下 =28. 652, p=0( 在 SPSS 输出 中 着 重 显示 ). 因为 w =0.05 超过 了 
p, MA, 有 充分 的 证 据说 明 拟 合 的 模型 对 工时 y 的 预测 是 统计 有 用 的 . 
b. 制造 商 感 兴 趣 的 假设 是 交互 作用 参数 p, ,特别 地 ， 
Hs: B4 = 0 
H : B, >0 
因为 我 们 检验 的 是 单个 B 参 数 ,所 以 用 了 检验 . 检验 统计 量 和 双 侧 p 值 (在 输出 中 着 重 显 示 ) 分 别 是 
了 =2. 233 p = 0. 033. 上 侧 p 值 是 双 侧 p 值 的 一 半 ， 即 0. 033/2 = 0. 0165. 因为 w =0. 05 超过 了 pÙ, 
制造 商 可 以 拒绝 H, 认为 当 设 计 压 强 (%, ) 增 加 时 ， 工时 随 容积 的 改变 速度 是 增加 的 , 即 x, 和 x 的 交 
互 作 用 是 正 的 ,因此 ， 交互 作用 项 应 该 包含 在 模型 中 . 
c. 要 估计 设计 压强 x, 每 增加 一 个 单位 时 , 工时 y 的 改变 量 , 我 们 需要 估计 当 锅 炉 容 积 x% = 
750 klb/h Hf, y 5j x, 的 直线 关系 的 斜率 . 一 个 不 细心 的 分 析 者 可 能 估计 这 个 斜率 是 8, = -1.53. 
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Coefficients? 


Unstandardized Standardized 
Coefficients Coefficients 
Std. Error Heta 
(Constant) 3012.677 732.354 4.114 .000 





CAPACITY 3.786 . .394 1.774 .D86 

PRESSURE -1.529 . -.314 -1412 .168 

CAP PRESS 003 002 345 2233 33 
a. Dependent Variable: MANHRS 





Model Summary 


Adjusted Std. Error of 
Tode R Square R Square the Estimate 





ES .729 ./03 1472.227 
a. Predictors: (Constant), CAP PRESS, PRESSURE, 
CAPACITY 
ANOVA^ 






Sum of 
Madel Squares Mean Square 


Regression 2E«008 62102055.14 n HN 
Residual 7E+007 » 2167451.542 
Total 3E+008 35 


a. Predictors: (Constant), CAP PRESS, PRESSURE, CAPACITY 
b. Dependent Variable: MANHRS 






图 11.10. 工时 交互 作用 模型 的 SPSS 回归 输出 


RE x, 的 系数 是 负 的 , 但 并 不 意味 着 , 随 着 设计 压强 的 增加 , 工时 会 减少 . 因为 存在 交互 作用 , 工时 
关于 设计 压强 的 改变 率 ( 斜 率 ) 依 束 于 锅炉 容积 x1. 因此 , 24 x, =750 BF, x; 每 增加 一 个 单位 , 估计 的 
y 的 改变 率 为 
估计 的 BER =a + 有 xi = - 1.53 +0.003(750) =0. 72 

换 句 话说 , 安装 一 个 容积 是 750 klb/h 的 锅 身 , 设计 压强 每 增加 1 Ib/in^ , 估计 所 需要 的 工时 将 增加 
大 约 0.72 工时 . 在 多 重 回 归 模 型 中 , 对 系数 的 符号 和 大 小 解释 要 特别 小 心 . 

例 11. 11 说 明 在 交互 作用 模型 中 , 对 B 参数 进行 了 检验 时 的 一 个 重要 点 , 这 个 模型 中 的 “最 重 
要 ”B 参数 是 交互 作用 项 的 B;. (注意, 这 个 B 也 是 与 模型 中 高 阶 项 xx2 相 联 系 的 参数 ). 因此 , 在 确 
定 了 整体 模型 对 预测 y 是 有 用 后 , 我 们 就 想 检 验 Ho: B, =0. 然而 , 一 旦 发 现 交 互 作用 (如 例 11.11)， 
对 一 阶 项 x; 和 x2 的 检验 就 不 必 进 行 , 因为 它们 是 没有 意义 的 检验 ; 交互 作用 的 存在 意味 着 两 个 x 都 
是 重要 的 . 

警告 : 一 旦 在 模型 E(y) =Bo +Bizi +B2x2 +B3x1x2 中 ， 认 为 交互 作用 是 重要 的 ， 就 不 必 对 一 阶 
3 x, 和 x 的 B 系 数 进行 了 检验 . 这 些 项 都 应 保留 在 模型 中 , 而 不 管 输出 中 显示 的 与 它们 关联 的 p 值 
X. 
应 用 练习 的 方法 . MVT 展示 改进 用 于 核 导 弹 外 这 的 碳 沫 执 
11.25 多 变量 检验 . Journal of the Reliability Analysis 圈 质 量 . 垫圈 通过 铸造 过 程 生产 ， 这 个 过 程 包括 混 

Cenier(2004 第 一 季度 ) 讨论 了 多 变量 检验 ( MVT) 合 配料 、 烘 烤 处 理 、 切 割 成 最 终 的 零件 . 一 种 缺陷 





O 一 个 项 的 阶 等 于 包含 在 该 项 中 定量 变量 的 指数 和 . Sik, 24 x, x, 都 是 定量 变量 时 , 交叉 乘积 x1, 是 一 个 二 阶 项 . 


426 


x 


第 11 章 





分 析 是 生产 垫圈 上 的 黑色 条 纹 数 y, 影响 缺陷 数 的 

两 个 变量 是 转台 速度 x, ( 转 / 分 ) 和 切割 刀 位 置 ( 距 

离 中 心 的 英寸 )x,. 

a. 研究 者 发 现 “刀口 位 置 和 转台 速度 之 间 存 在 交 
互 作用 ” ,为 E(y) 假 设 一 个 体现 这 种 交互 作用 
的 模型 . 


11.27 


画 出 光 密度 (y) 和 波段 频率 (x ) 之 间 的 关系 . 

化 学 制品 产量 研究 . 为 了 研究 温度 (7) ME 
强 (P) 对 化 学 制品 产量 y 的 影响 , 现 进行 一 项 实 
验 . 有 两 个 因素 (温度 和 压强 ) ,每 一 个 因素 在 两 
个 水 平 上 保持 不 变 , 7 取 50C 和 70%XC,P 取 10 1b/ 
in^ 和 20 Ib/in^, 测量 4 个 不 同 组 合 下 的 产量 , 结果 





b. 研究 者 报告 , 缺陷 数 (y) 和 转台 速度 (x ) 之 间 存 如 下 表 所 示 . 
在 正 的 线性 关系 , 但 发 现 对 于 切割 刀 位 置 (x,) OO 
的 较 小 值 , 这 种 关系 的 斜率 更 陡峭 . 这 在 a PH 
型 的 交互 作用 项 意味 着 什么 ?请 解释 , 

11.26 液体 的 光 密度 . 参考 练习 11.5, Applied Spec- 50 10 26.0 

troscopy 对 液体 PPFPO 的 红外 吸收 的 光 密 度 (y) 的 50 20 28.4 

研究 . ER T OCSE HE, 还 测量 了 12 次 试验 的 波段 频 50 20 28.1 

率 (x ) 和 胶片 厚度 (x, ). (数据 保存 在 文件 PPFPO 70 10 22.1 

中 . ) 70 10 20.8 

a， 写 出 光 密度 (y) 作为 波段 频率 (x ) 和 胶片 厚度 70 20 16.7 
(x, ) 函数 的 交互 作用 模型 . 70 20 15.3 


bp， 给 出 陈述 “波段 频率 和 胶片 厚度 交互 作用 ”的 实 
际 解释 . 

c. a 中 交互 作用 模型 的 MINITAB 输出 在 本 页 底部 ， 
给 出 最 小 二 乘 预测 方程 . 

d. 有 充分 的 证 据 (a =0.01) 说 明 波段 频率 和 胶片 
厚度 存在 交互 作用 吗 ? 

e. 对 胶片 厚度 的 每 一 个 水 平 , 利用 模型 的 6 估计 


a 对 数据 拟 合 线性 模型 ; 
ECy) =Bo +B x, *Byx + [x x, 
b. Fe 20.01 对 模型 的 整体 恰当 性 进行 检验 . 
c. 有 充分 的 证 据说 明 温度 和 压强 之 间 存 在 交互 作 
用 吗 ? 用 a 20.01 检验 . 











| The regression equation is ] 
DENSITY = - 0.214 + 0.000257 FREQ - 3.72 THICK + 0.00497 FREQ THICK 
Predictor Coef SE Coef T P 
Constant -0.2143 D.6866 -0.31 0.763 
FREQ 0.0002567 0.0007157 0.36 0.729 
THICK -3.7200 0.9147 -4.07 0.004 
FREQ THICK 0.0049655 00.0009535 5.21 0.001 
8 = 0.205676 R-Sq = 96.05 R-Sq(adj) = 94.5s 
Analysis of Variance 
Source DF SS MS F P 
Regression 3 8.0481 2.6827 63.42 0.000 
Residual Error 8 0.3384 0.0423 
Total 11 68.3865 
L 





练习 11. 26 的 MINITAB 输出 
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11.28 地 下 水 中 的 砷 . 参看 练习 11.20, Environmen- 

tal Science and Technology( 2005 年 1 月 ) 检 验 地 下 水 

中 砷 的 商用 设备 的 可 靠 性 研究 . 回忆 对 保存 在 文件 

ASWELLS 中 的 数据 拟 合 了 砷 水 平 (y) 作为 纬度 

(x1), £&BE (x, ) 和 深度 (2 ) 函数 的 一 阶 模型 . 

a. 为 砷 水 平 (y) 建 立 一 个 包括 纬度 、 经 度 和 深度 的 
一 阶 项 , 以 及 纬度 和 深度 、 经 度 和 深度 的 交互 作 
用 项 的 模型 . 

b. 对 文件 ASWELLS 中 的 数据 , 用 统计 软件 拟 合 a 
中 的 交互 作用 模型 ,给 出 最 小 二 乘 预测 方程 . 

c. 通过 检验 (a = 0. 05) 确定 纬度 和 深度 的 交互 作 
用 对 砷 水 平 是 否 有 影响 ? 

d. 通过 检验 (a = 0. 05 ) 确定 经 度 和 深度 的 交互 作 
用 对 砷 水 平 是 否 有 影响 ? 

e. 解释 <, d 检验 结果 的 实际 意义 . 

11.29 燃气 轮机 的 冷却 方法 , 参考 练习 11.21, Jour- 

nal of Engineering for Gas Turbines and Power( 2005 年 

1 月 ) 对 燃气 涡轮 发 动机 的 高 压 注 雾 研究 . 回忆 热 

消耗 率 (y) 作 为 转速 (x, )、 注 人 温度 (x,)、 排 出 气 

温 (x;)、 转 速 压力 比 (%xs) 和 空气 流量 比 (x; ) 的 函 

数 , 对 保存 在 文件 GASTURBINE 中 的 数据 拟 合 一 

阶 模型 . 

a. 研究 者 假设 热 消耗 率 (y) 和 温度 (注入 和 输出 ) 
之 间 的 线性 关系 依赖 于 空气 流量 比 . 结合 研究 
者 的 理论 , 为 热 消 耗 率 建立 一 个 模型 . 

b. 对 文件 GASTURBINE 中 的 数据 , 用 统计 软件 拟 
合 a 中 的 交互 作用 模型 ,给 出 最 小 二 乘 预 测 


方程 . 

c. 通过 检验 (a =0.05) 确 定 注 人 温度 和 空气 流量 
比 的 交互 作用 对 热 消耗 率 是 否 有 影响 ? 

d. 通过 检验 (a = 0.05) 确定 排出 气温 和 空气 流量 
比 的 交互 作用 对 热 消耗 率 是 否 有 影响 ? 

e. 解释 c,d 检验 结果 的 实际 意义 . 


11.30 ”田纳西 河中 的 鱼 污染 , 参考 练习 11. 22 美国 


陆军 工兵 部 队 的 鱼 污染 数据 . 拟 合 DDT JOE (y) X 

于 上 游 英里 数 (x, )、 鱼 的 身长 (2 ) 和 鱼 的 体重 (x,) 

的 一 阶 模型 ， 

a. 根据 假设 : 对 重 污染 的 鱼 , DDT 水 平 关于 身长 的 
增长 率 更 快 ,提出 一 个 E(y) 的 模型 , 

b. 对 文件 DDT 中 的 数据 , 用 统计 软件 拟 合 a 中 的 
模型 ,给 出 最 小 二 乘 预 测 方程 . 

e. 用 a=0.1 检 验 a 中 的 理论 . 你 得 出 什么 结论 ? 


11. 31 从 油 中 分 离 水 . 参考 练习 11.23, Journal of 


Colloid and Interface Science( 1995 年 8 月 ) 关 于 影响 

从 油 中 分 离 水 所 需 电 压 水 平 (y) 的 因素 研究 ,数据 

保存 在 文件 WATEROIL rh. 

a. 考虑 仅 利 用 体积 (xi ) 和 含 盐 量 (x, ) 预测 y， 写 出 
E(y) 的 交互 作用 模型 的 方程 . 

b. 对 WATEROIL 文件 中 的 数据 , 用 统计 软件 拟 合 
a 中 的 交互 作用 模型 . 

c. 通过 检验 (a = 0. 10) 确定 体积 和 含 盐 量 的 交互 
作用 是 否 对 电压 水 平 有 影响 ? 

d. 当 含 盐 量 固定 在 x, = 4% 时 , 给 出 体积 每 增加 
1 和 % 时 , 电压 (y) 的 改变 量 的 估计 . 


11.9 定量 预测 量 的 二 阶 (二 次 ) 模型 


前 面 几 节 讨 论 的 所 有 模型 都 提出 EO) 和 模型 中 的 每 个 自 变量 是 直线 关系 . 在 本 节 中 , 我 们 考虑 
允许 y 与 单个 预测 变量 x 具有 曲线 关系 的 非 线 性 模型 . 因为 它 将 包含 2 项 ， 所 以 这 个 模型 是 二 阶 
模型 . 

这 种 称 为 二 阶 模型 的 模型 形式 是 : 

Y =Po + Biz + B>x2 + £ 
BE x^ 的 项 叫做 二 次 项 (或 二 阶 项 ) , 它 使 假设 y XT x 的 响应 模型 图 像 是 曲线 . 二 次 模型 对 p, 的 两 
个 不 同 值 的 图 像 如 图 11. 11 所 示 . 当 曲 线 的 开口 向 上 时 , B, 的 符号 是 正 的 ( 见 图 11. lla); 当 曲 线 的 
开口 向 下 时 ,62 的 符号 是 负 的 ( 见 图 11. 11b). 


单个 定量 自 变量 的 二 次 {二 阶 ) 模 型 
E(y) 2 By +B,x, +B, 
其 中 , Bo 是 曲线 的 y 轴 截 距 ,，B, 是 位 移 参数 , p 是 曲率 . 
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a) Bx > 0 tb) 5 < 0 


图 11.11 两 个 二 次 模型 的 图 像 





DEEA 在 全 电器 化 家 庭 中 , 消费 者 、 建 筑 商 和 能 源 保护 者 组 织 关心 的 是 消耗 的 电量 . 假定 我 们 
要 研究 全 电器 化 家 庭 中 , 月 用 电量 y 和 房屋 的 面积 x 之 间 的 关系 , 并 且 假定 我 们 认为 月 用 电量 和 房 
”屋面 积 之 间 的 关系 是 二 次 模型 ， 
y=Bo *tBix + By? + £ 

为 了 拟 合 模型 , 在 某 月 收集 了 10 CRER yM a 值 , 数据 列 在 表 11.6 rh. 

a. 构造 数据 散 点 图 ,有 证 据 支 持 使 用 二 次 模型 吗 ? 

b. 用 最 小 二 乘法 估计 二 次 模型 中 的 未 知 参数 po, B. Bo. 

c. 画 出 预测 方程 图 像 ， 从 图 像 和 数值 来 评价 模型 拟 合 数 据 有 多 好 . 

d. 解释 B 估计 值 . 

e. 整体 模型 对 预测 用 电量 y 有 用 吗 (w=0.01)? 

f. 有 充分 的 证 据说 明 用 电量 和 房屋 面积 之 间 的 关系 是 向 下 止 的 吗 ? 用 a = 0. 01 检验 . 

解 a 用 MINITAB 产生 表 11.6 中 数据 的 散 点 图 如 图 11. 12 所 示 . 图 像 说 明 , 用 电量 关于 房屋 面 
积 是 以 曲线 形式 增加 的 ,这 为 模型 中 包含 二 次 项 x? 提供 了 支持 . 











表 11.6 房屋 面积 -用 电量 数据 Scatterplot of USAGE vs SIZE 
2000 
房屋 面积 x(ft? ) 月 用 电量 y(kW : h) 1900 
1 290 1 182 1800 
1 350 1172 1700 
1 470 1 264 W 1600 
< 

1 600 1 493 $$ 1500 
1 710 1571 1400 
1 840 1711 1399 
1 980 1 804 1200 

1100 
2 230 1 840 1500 2000 2500 3000 
2 400 1 956 SIZE 
2 930 1 954 图 11.12. 用 电量 数据 的 MINITAB 散 点 图 





b. 我 们 用 SAS 对 表 11. 6 中 的 数据 拟 合 这 个 模型 . SAS 回归 输出 的 部 分 结果 如 图 11. 13 所 示 . B 
参数 的 最 小 二 乘 估 计 ( 着重 显示 ) 是 所 = - 1216.14, B, 2.39893, B, = — 0.00045. 因此 ， 使 数据 的 


多 重 回归 分 析 429 








Dependent Variable: USAGE 
Number of Observations Head 10 
Number of Observations Used 10 
finalysis of Variance 
Sum of Mean 
Source DF Squares Square F Value Pr > F 
Mode 1 2 831070 415535 189.71 €«.0001 
Error 7 15333 2190.36480 
Corrected Total 9 845402 
Root MSE 46.80133 R-Square 0.9819 
Dependent Mean 1594.70000 füdj R-Sg 0.9767 
Coeff Var 2.93480 
Parameter Estimates 
Parameter Standard 
Variable DF Estimate Error t Value Pr > iti 
Intercept 1 =1216.14389 242.80637 -5.01 0.0016 
SIZE 1 2.239893 0.24584 9.76 <.0001 
SIZESQ 1 -0.00045004 0.00005908 -7.62 0.0001 











图 11. 13 用 电量 模型 的 SAS 回归 输出 


SSE 达到 最 小 的 方程 是 : 
$ = - 1216. 14 +2. 3989x — 0. 00045x? 
c. 图 11. 14 是 最 小 二 乘 预测 方程 图 . 注意 , 这 个 图 对 表 11.6 中 的 数据 提供 了 一 个 好 的 拟 合 . 拟 
合 的 数值 度量 由 调整 的 决定 系数 RO 可 得 . MA SAS 输 


Fitted Line Plot 





出 知 , R2 = 0. 9767, 这 意味 着 在 用 电量 的 样本 变 差 USAGE = - 1216 + 2.399 SIZE - 0.000450 SIZE**2 
h, 大 约 有 98% 可 以 用 二 次 模型 来 解释 ( 调整 样本 oo com 
大 小 和 自由 度 后 ). Pa 

d. ZURA R ORRERA y o z 
慎 . 首先 , 估计 的 y 截 距 bo 只 有 当 自 变量 的 值 域 包 Š isoo "d 
150, 即 如 果 *=0 包含 在 «的 样本 范围 内 时 , 解释 eo Pa 





才 有 意义 . 尽管 有 = - 1216. 14 似乎 说 明 , 24 x -0 i1200| .A 
时 ,估计 的 用 电量 是 负 值 , 但 因 这 个 零点 不 包括 在 OL CCC 
样本 的 值 域 内 (x 的 最 小 值 是 1290 f), 所 以 0 值 SIZE 
(0 经 的 房屋 ) 没有 意义 ,因此 启 的 解释 没有 意义 ”图 11.14 用 电量 的 最 小 二 乘 模型 MINITAB 图 

x 的 系数 估计 是 ĝi =2. 3928, 在 平方 项 妇 存 在 的 情况 下 , 它 不 再 代表 斜率 9. 一般 地 , 二 次 模型 
中 的 一 阶 项 x 的 系数 估计 不 再 有 明确 意义 的 解释 . 因此 , 没有 必要 对 B, 进行 任何 统计 推断 分 析 ( 如 








O 对 具有 微 积分 知识 的 学 生来 说 , 二 次 模型 的 斜率 就 是 一 阶 导 数 ay/ax - B, +2B,x， 因 此 , 斜率 作为 x 的 函数 而 变化 ,而 
不 是 与 直线 模型 关联 的 常数 斜率 . 
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置信 区 间或 检验 ). 

二 次 项 过 的 系数 记 的 符号 指出 曲线 是 向 下 凹 ( 山 形 ) 还 是 向 上 凹 ( 碗 形 ). 89 ñ, 意味 着 向 下 
M, 如 本 例 ( 图 11.14) , ER Â, SEHE IS] ET. 我 们 用 如 图 11. 14 的 模型 图 像 表 示 , 而 不 是 解释 局 本 
身 的 数值 , 来 描述 模型 . 

注意 图 11.14 说 明 ， 当 房屋 面积 增加 到 2500 f? 时, 估计 的 用 电量 趋 于 稳定 . FLE, 如果 我 们 
将 模型 展开 到 4000 f” 及 以 外 时 , 模型 的 凹 性 将 导致 用 电量 的 减少 (如 图 11.15). 然而 , 对 自 变 量 范 
围 以 外 , 模型 的 解释 没有 意义 , 本 例 中 自 变量 的 最 大 值 是 2930 亿 . 因此 ,尽管 模型 似乎 支持 假设 : 
在 房屋 面积 接近 样本 值 的 最 大 值 时 , 每 平方 英尺 的 增长 率 减 少 , 但 对 非常 大 面积 的 房屋 , 用 电量 实 
际 上 是 减少 的 结论 是 对 模型 的 误 用 , 因为 样本 中 没有 包含 3000 f£? 或 更 大 面积 的 房屋 . 























人 i I 
在 自 变量 范围 内 使 用 模型 | 
l | 
变量 范围 之 外 
19 [- t, 自 变量 范围 之 人 
一 ! I <. 
< i ! * 
. 1 I `. 
= t I ` 
Š 1600 | | EN 
bal [d | `. 
型 1 1 ` 
E ! ! `. 
Taser o! ! 
| 没有 意义 的 预测 
I ! 
100  ! | 
Ll ia í s do | Li L. | >x 
1,000 1,500 2,000 2,500 3,000 3,500 4,000 I 


BEL CO) 
图 11.15 二 次 模型 的 可 能 误 用 


e. 为 了 检验 二 次 模型 是 否 统计 有 用 , 我 们 进行 全 局 FRE. 
Hy: Bı 2B, =0 
H,: 上述 系数 中 至 少 有 一 个 不 等 于 零 . 
从 图 11.13 的 SAS 输出 中 知 , 检验 统计 量 己 = 189.71, 对 应 的 p 值 <0. 0001. 对 于 任意 合理 的 w ,我们 
拒绝 三 ,认为 整体 模型 对 用 电量 y 的 预测 有 用 . 
£ 图 11. 14 显示 , 在 10 个 数据 点 的 样本 中 , 房屋 面积 和 用 电量 之 间 的 关系 是 向 下 目的 曲线 . 为 
了 确定 在 总 体 中 是 否 存在 这 种 曲线 的 类 型 ,我 们 要 检验 ， 
Ho: B, =0( 在 响应 曲线 中 没有 弯曲 ) 
H, : B, <0( 在 响应 曲线 中 存在 下 冲 ) 
在 输出 中 着 重 显示 的 检验 B, 的 检验 统计 量 值 了 = -7. 62, 相应 的 双 侧 p 值 是 0.0001. 因为 这 是 音 
Wide, 所 以 合适 的 p 值 是 0.0001/2 = 0. 000 05. 现在 a=0.01 超过 了 p 值 , 因此 , 有 充分 的 证 据 
W, 总 体 中 存在 向 下 弯曲 的 趋势 : 即 大 面积 房屋 比 小 面积 房屋 每 平方 英尺 的 用 电量 的 增加 比较 
缓慢 . 
EE: 图 11. 13 的 SAS 输出 也 提供 了 假设 加 : Bo =0 和 =0 的 了 检验 统计 量 及 相应 的 双 侧 p M 
因为 对 这 个 模型 来 说 , 这 些 参 数 的 解释 没有 意义 ， 所 以 对 这 些 检验 不 感 兴趣 . 
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应 用 练习 

11.32 ”检测 腿 部 运动 的 阻抗 . 参考 练习 2.36, IEICE 
Transactions on Information and Systems (2005 年 1 
月 ) 关 于 检测 腿 部 运动 的 阻抗 试验 . 回忆 工程 师 把 
电极 贴 在 志愿 者 的 脚 躁 和 膝盖 上 , 测量 阻抗 变化 
的 信 品 比 ( SNR). 对 最 适度 的 躁 — 膝 电极 对 , 工程 
师 考察 膝 关节 的 角度 x( 度 ) 和 膝 阻抗 变化 y(0) 之 
间 的 关系 . 对 数据 拟 合 二 次 模型 的 结果 如 下 : 

y =24. 83 +0. 041x +0. 0005x?, R? =0. 903 

a. 画 出 最 小 二 乘 预测 方程 图 , 指出 由 模型 估计 的 


曲率 性 质 . 
b. 对 膝 关节 角度 x =50° 的 电极 对 , 预测 膝 阻抗 的 
变化 (y). 
c. 解释 R^ 的 值 . 
11.33 ”估计 变 点 剂量 . 研究 有 毒物 质 及 其 对 人 类 影 


响 的 标准 方法 是 观察 暴露 在 各 种 剂量 的 有 毒物 质 
中 嘴 此 动物 随时 间 的 反应 . 在 Journal of Agricultur- 
al, Biological, and Environmental Statistics (2005 #E 6 
月 ) 中 , 研究 者 用 最 小 二 乘 回归 方法 估计 “ 变 点 ” 剂 
量 一 一 定义 为 没有 不 利 影响 的 最 大 剂量 水 平 . 数据 
从 暴露 在 有 毒物 质 阿 考 烟 肘 中 老鼠 的 剂量 反映 研 
究 中 得 到 . 将 50 只 老鼠 分 成 5 个 剂量 组 ; 0, 100, 
200, 500 和 750 mg/kg 体重 . 因 变量 y 是 暴露 两 周 
以 后 体重 的 改变 量 (g). 研究 者 拟 合 二 次 模型 
E(y) =B, t Byix * Box ,其 中 x= 剂 量 水 平 , 拟 合 结 
果 是 : 了 = 10. 25 +0. 0053x - 0. 000 026 6x’. 

a. 通 最 小 二 乘 预 测 方程 的 草图 ,描述 估计 的 模型 

曲率 性 质 . 
b. 对 给 定 的 阿 考 烟 及 剂量 500 mg/kg, 估计 老鼠 的 


体重 变化 (y). 

c. WRZ MALE EE AE 0, 估计 老鼠 的 体重 变化 
(y) (这 个 剂量 称 为 “控制 "剂量 水 平 ). 

d. 找 出 最 大 剂量 水 平 x, 使 在 此 水 平 下 估计 的 体重 
变化 低 于 控制 组 的 估计 体重 变化 . 这 个 值 就 是 
“ 变 点 ”剂量 [提示 : 找 x 的 值 , 使 得 E(ylx) < 
E(ylx 20) ]. 

11.94 ”车辆 俊 化 转化 器 . 将 二 次 模型 应 用 于 墨西哥 
城 从 1984 年 到 1999 年 收集 到 的 机 动车 辆 排放 的 有 
毒物 质数 据 ( Environmental Science & Engineering , 
9,1,2000). 下 面 的 方程 用 来 预测 墨西哥 城 在 给 定 
WEC), 没有 催化 转化 器 的 机 动车 辆 的 百分比 
(y): ? =325 790 -321. 67x +0. 794.2. 

a. 说 明 为 什么 包 =325 790 没有 实际 解释 ? 

b. 说 明 为 什么 局 = -321. 67 不 能 解释 为 斜率 ? . 

c. Erde B, 的 值 , 确定 样本 数据 的 曲率 性 质 ( 向 上 
或 向 下 ). 

d. 研究 者 用 模型 估计 “就 在 2021 年 以 后 , 带 有 催 
化 转化 器 的 车 队 将 完全 消失 . "评论 利用 模型 预 
测 2021 年 y 的 危险 性 . 

11.35 脑 疾 病 的 遗传 学 . 少 髓 小 脑 型 共 济 失 调 I 型 
(SCAT) 是 一 种 由 大 脑 功能 异常 引起 的 遗传 性 中 枢 
神经 系统 退化 性 疾病 . 从 SCA1 染色 体 的 DNA 分 
析 , 研究 者 发 现 重复 基因 序列 的 存在 . ( Cell Biolo- 
gy, 1995 年 2 月 . ) 一 般 地 , 观测 到 的 重复 序列 越 
多 , 疾病 发 作 越 早 ( 年 龄 ). 对 收集 到 的 113 个 诊断 
为 SCA1 个 体 数据 , 散 点 图 说 明了 这 种 关系 . 
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a， 假 如 想 对 疾病 发 作 年 龄 y 作为 SCA1 染色 体 中 行走 长 度 ( 步 数 ) ERTE 自 回避 行走 
重复 基因 序列 数 x 的 函数 进行 建 模 , 为 y 提出 
一 个 二 次 模型 . 2 2 12 
b. a 中 模型 B, 的 符号 是 正 的 还 是 负 的 ? 根据 散 点 ds 
图 表示 的 结果 做 出 你 的 决策 . i. 
c. 研究 者 记录 年 岭 和 重复 数 之 间 的 相关 性 r = M wy 
-0. 815. HX R = ( -0.815)? =0. 664. 所 以 ， of 
他 们 认为 发 作 年 龄 的 变异 中 , KAH 66% 归结 ° 3$ š 
为 “重复 ” 数 . 这 种 说 法 能 应 用 到 二 次 模型 ý IE 24972 
8 388 5 916 


E(y) =B * Byx * Box! 中 吗 ? 如 果 不 能 , 给 出 能 





应 用 的 模型 方程 . 

11.36 行走 研究 . American Scientist(1998 年 7 月 至 
8 月 ) 公 布 了 关于 自 回避 行走 和 无 根 行走 之 间 关 系 
的 研究 . 在 自 回 避 行 走 中 , 从 来 不 会 重复 或 穿 过 自 
己 的 路 径 ， 而 无 根 行走 是 起 点 和 终点 无 法 分 辨 的 
一 种 路 径 . 各 种 长 度 的 每 种 类 型 行走 的 可 能 个 数 记 
录 在 下 表 中 . 假定 想 对 无 根 行走 个 数 (y) 作为 行走 
长 度 (x) 的 函数 建 模 , 考 虑 二 次 模型 E(y) = B, + 
Bix +B, ,有 充分 的 证 据说 明 y x 之 间 的 关系 是 
向 上 四 的 曲线 吗 ? 用 a =0. 1 检验 . 


资料 来 源 : Hayes, B. “ How to avoid yourself. ” American Sci- 
entist, Vol. 86, No. 4, July-Aug. 1998, p. 317( ËI 5) 


11.37 ” 海 冰 融 化 池 的 特征 . 表面 反照 率 定义 为 表面 
的 反射 太阳 能 和 人 入射 太阳 能 之 比 , 它 是 海 冰 的 一 个 
关键 气候 参数 . 国家 冰雪 数据 中 心 (NSIDC) 收 集 了 
加 拿 大 北极 冰 融 化 池 的 反照 率 、 深 度 和 物理 特征 
( 见 例 2. 1) ,位 于 加 拿 大 北极 的 巴 罗 海 峡 504 个 冰 
融化 池 的 数据 保存 在 文件 PONDICE 中 . 环境 工程 
师 想 调查 冰 的 宽带 表面 反照 率 水 平 y 和 池 的 深度 
x(m) 的 关系 . 


Scatterplot of broadband-alb vs depth 
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练习 11. 37 的 MINITAB 散 点 图 


a. PONDICE 数据 的 散 点 图 显示 在 上 面 ,基于 散 点 
图 , 为 E(y) 作 为 x 的 函数 假设 一 个 模型 . 
b. 对 文件 PONDICE 中 的 数据 , WMA a 中 的 模型 ， 
出 最 小 二 乘 预测 方程 . 
- 用 a =0.01 对 模型 的 整体 恰当 性 进行 检验 . 
d. 用 a 20.01 对 模型 中 任意 的 重要 B 参数 进行 


p^ 


H 


° 


检验 . 
e. RHR R M s 的 值 , 并 解释 . 

11.38 森林 片断 研究 . 参考 练习 10. 33, Conservation 
Ecology(2003 年 12 月 ) 关 于 54 片 南美 森林 片断 化 原 
因 的 研究 . 回忆 生态 学 家 对 每 片 森林 提出 了 两 个 片 
断 指标 : 一 个 是 人 为 片断 指标 (y) , 另 一 个 是 由 自然 
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原因 导致 的 片断 指标 (xz). 54 片 森林 的 这 2 个 指标 
数据 保存 在 文件 FORFRAG 中 (前 5 个 观测 值 列 在 下 
表 中 ). 在 练习 10.33, 去 掉 3 个 有 最 大 人 为 指标 的 
森林 数据 后 , 对 数据 拟 合 了 一 个 简单 线性 模型 . 现 


学 的 电子 工程 师 研究 了 碳 氟 化 合 物 等 离子 体 的 动力 
学 以 便 优 化 材料 加 工 . 研究 的 一 部 分 是 关闭 射频 功 
率 后 , 在 不 同 的 时 间 点 (ps), 测量 生产 过 程 中 释放 
的 碳 氟 化 合 物 原子 的 表面 转化 率 , 数据 列 在 附 表 中 ， 


在 ,考虑 E(y) 的 二 次 模型 . 建立 表面 转化 率 (y) 关 于 时 间 (%) 的 模型 . 








(前 5 个 观测 值 列表 ) 转化 率 时 间 | 转化 率 时 N 

生态 区 (森林 ) 人 为 指标 y 自然 指标 x 1.00 0.1 0.00 1.7 
Araucaria moist forests 34. 09 30. 08 0. 80 0.3 -0.10 1.9 
Atlantic Coast restingas 40. 87 27. 60 0.40 0.5 -0.15 2.1 
Bahia coastal forests 44.75 28. 16 0. 20 0.7 -0.05 2.3 
Bahia ineerior forests 37. 58 27. 44 0.05 0.9 -0.13 2.5 
Bolivian Yungas 12. 40 16.75 0.00 L1 -0.08 2.7 
资料 来 源 : Wade, T. G. et al. “ Distribution and causes of - 0. 05 1.3 0.00 2.9 
global forest fragmentation. " Conservation Ecology, Vol. 72, -0.02 1.5 











No.2，Dec.2003( 表 6) 

a. 对 文件 FORFRAG 中 的 所 有 数据 用 最 小 二 乘法 拟 
合 二 次 模型 . 给 出 最 小 二 乘 预测 方程 . 

b. 根据 问题 的 内 容 解释 Bu, B, Ba 的 估计 . 

e. 有 充分 的 证 据说 明 自 然 指标 (*) 和 人 为 指标 (7) a 画 出 数据 的 散 点 图 , 观测 到 什么 趋势 
具有 曲线 关系 吗 ? 用 a =0. 05 检验 . b. 对 数据 拟 合 二 次 模型 ,给 出 最 小 二 乘 预测 方程 . 


11.39 碳 拨 化 合 物 等 离子 体 的 动力 学 . 碳 所 化合物 uL 有 充分 的 证 据说 明 关闭 后 表面 转化 率 与 时 间 的 关 
等 离子 体 用 于 半导体 材料 的 生产 . 在 Journal of Ap- 系 曲 线 是 向 上 弯曲 的 吗 ? 用 a = 0. 05 检验 . 
plied Physics( 2000 年 12 月 1 日 ) 中 , 日 本 名 古 屋 大 


11.10 REBRE: 残 差分 析 


残 差 是 y 的 真 值 和 它们 相应 的 预测 值 的 差 y - +, 残 差分 析 常 常 提供 可 能 致使 修正 和 改进 回归 模 
型 的 信息 . 这 种 修正 可 能 是 由 于 下 面 三 种 原因 之 一 : (1) 错 误 指定 了 模型 的 确定 性 分 量 ; (2) 关于。 
的 一 个 或 多 个 假定 不 成 立 ; (3) 用 来 拟 合 模型 的 数据 包含 一 个 或 多 个 异常 值 

定义 11.2 回归 残 差 & 定义 为 观测 值 y 和 它 对 应 的 预测 值 的 差 : £ = y. — $. 

检测 模型 的 错误 指定 在 回归 分 析 中 , 分析 残 差 的 一 种 方法 是 画 出 每 个 残 差 值 关于 对 应 的 自 恋 
ia 值 的 图 . (如 果 模 型 中 包含 的 自 变量 多 于 一 个 , 则 对 每 表 11.7 房屋 面积 -用 电量 数据 
个 自 变量 构造 一 个 图 . ) 这 个 图 有 助 于 检测 是 否 错误 指定 了 


资料 来 源 : Takizawa, K., 
cals in high-density C4Fs plasmas studied by laserinduced fluo- 


et al. “Characteristics of C, radi- 


rescence spectroscopy." Journal of Applied Physics, Vol. 88, 
No. 11, Dec. 1, 2000( El 7) 





房屋 面积 x 每 月 用 电量 y 

模型 的 确定 性 分 量 ， 看 下 面 的 例子 . (ñ2) (kW . h) 
参考 例 11. 12 中 房屋 面积 x 和 用 电量 y 之 间 关 1 290 1182 
系 的 建 模 问题 . n = 10 个 房屋 的 数据 重复 列 在 表 11.7 中 ,用 »^ P 
直线 模型 和 二 次 模型 拟 合 数据 的 MINITAB 输出 分 别 在 图 1 600 1 493 
11. 16a 和 图 11. 16b 给 出 . 这 些 模型 的 残 差 在 图 中 着 重 显示 . 1710 1 571 
以 残 差 为 纵 轴 、 变 量 x( 房 屋 的 面积 ) 为 横 轴 的 残 差 图 分 别 如 980 ao 
图 11. 17a 和 图 11. 17b FFR. 2 230 1 840 

a. 验证 每 个 残 差 等 于 观测 值 y 和 估计 的 均值 了 的 差 . 2 400 1956 


2 930 1 954 
—— —  _ > 


b. 分 析 残 差 图 . 
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The regression equation is 
USAGE = 579 + 0.540 SIZE 


Predictor Coef SE Coef T P 

Constant 578.9 167.0 3.47 0.008 

SIZE 0.54030 0.08593 £6.29 0.000 

5 = 133.438 R-3q = 83.25 R-Sq(adj) = 81. 

ànalysis of Variance 

Source DF SS MS F 

Regression 1 "703957 703957 39.54 D 

Residual Error 8 142445 17806 

Total 9 846402 

Obs SIZE USAGE Fit SE Fit Residual 
1 1290 1182.0 1427?5;9 66.0 3.9 
2 1350 1172.0 1308.3 62.1 -136;.3 
3 1470 1264.0 1373.2 55.0 -109.2 
5 1600 1493.0 1443.4 38.6 49.6 
5 1710 1571.0 1502.8 44.7 68.2 
6 1840 1711.0 1573.1 42.3 137.9 
" 1980 1804.0 1648.7 43.1 155.3 
8 2230 1840.0 1783.8 51.8 56.2 
9 2400 1956.0 1875.2 61.5 80.3 
10 2930 1954.0 2162.0 99.6 -208.0 


R denotes an observation with a large standardized residual. 


P 


‘O00 


St Resid 
-0.81 
-1.15 
-0.90 

0.40 
0.54 
1.09 
1.23 
0.46 
0.68 
-—2.34R 











a) 用 电量 的 直线 模型 的 MINITAB 输出 





The regression equation is 











USAGE = ~ 1216 + 2.40 SIZE - 0.000450 SIZESQ 

Predictor Coef SE Coef T P 

Constant -1216.1 242.8 -5.01 0.002 

SIZE 2.39898 0.2458 9.76 0.000 

SIZESQ -0.00045004 .0.00005908 -7.62 0.000 

Š = 46.8013 R-Sq = 98.25 R-Sq(adj) = 97.7% 

Analysis of Variance 

Source DF SS MS F P 

Regression 2 831070 415535 189.71 0.000 

Residual Error 7 15333 2190 

Total 9 846402 

Obs SIZE USAGE Fit SE Fit Resid 
1 1290 1182.0 4328.6 30.1 1.46 
2 1350 1172.0 1202.2 25.9 -0,77 
3 1470 1264.0 1337.8 19.8 "usus -1.74 
4 1600 1493.0 1470.0 17.4 45.0 0.53 
S 1710 1571.0 1570.1 18.0 us 0.02 
6 1840 1711.0 1674.2 19.8 36.8 0.87 
7 1980 1804.0 1769.4 21.9 mas 0.84 
8 2230 1840,0 1895.5 23.3 55.5 -1.37 
9 2400 1956.0 1949.1 23.6 65 0.17 
10 2930 1954.0 1949.2 44,7 aug 0.35 X 


X denotes an observation whose X value gives it 


large influence, 








b) 用 电量 的 二 次 模型 的 MINITAB 输出 
图 11. 16 用 电量 的 MINITAB 输出 


多 重 回归 分 析 435 





























Residuals Versus SIZE Residuals Versus SIZE 
(response is USAGE) (response is USAGE) 
200 十 一 mol e 
| . °. e 
100 . . 25 °. 
5 * M o _. hd ° 
$ "| 
$ 
č č 25] i 
- 100 d + . 
* -50 °. 
-200 4 ° | -75 . i 
1500 2000 2500 3000 1500 2000 2500 3000 
SIZE SIZE 
a) 用 电量 的 直线 模型 的 MINITAB 残 差 图 b) 用 电量 的 二 次 模型 的 MINITAB 残 差 图 


图 11.17 用 电量 的 MINITAB 残 差 图 


解 a 考虑 数据 集中 第 一 个 用 电量 值 y = 1182. 对 于 直线 模型 , 这 个 观测 的 预测 值 是 了 = 
1275. 92( 图 11. 16a 中 着 重 显 示 ). 因此 , RZE: 
&-(y-5) 21182 -1275.9 = -93.9 
类 似 地 ,对 于 二 次 模型 , 第 一 个 y 值 的 残 差 (图 11. 16b) 是 : 
&=1182 -1129.6 =52. 4 
这 两 个 残 差分 别 和 图 11. 16a、 图 11. 16b 中 标 为 “Residual” 列 给 出 的 第 一 个 值 相同 (四 售 五 人 ). 尽管 
两 个 残 差 都 对 应 于 相同 的 观测 值 y = 1182, 但 残 差 不 同 . 这 是 因为 预测 的 均值 的 改变 依赖 于 使 用 的 是 
直线 模型 还 是 二 次 模型 . 剩 下 的 残 差 可 以 类 似 计算 . 

b. 直线 模型 的 MINITAB 残 差 图 (图 11. 17a) 揭示 了 非 随 机 模式 . 残 差 呈现 出 曲线 形式 ， 对 于 小 
H x 值 , 残 差 位 于 水 平 0( 残 差 的 均值 ) 线 之 下 ; 对 于 中 等 大 小 的 x 值 , 残 差 位 于 0 直线 之 上 ; 而 对 于 
最 大 的 x 值 , 残 差 又 位 于 0 直线 之 下 . 这 说 明 在 x 的 这 些 范围 (小 、 中 、 大 ) 之 中 随机 误差 的 均值 可 能 
不 等 于 0. 这 样 的 模式 通常 表示 模型 中 应 添加 曲率 项 . 

当 二 阶 项 加 入 模型 时 , 非 随机 模式 消失 了 . 在 图 11. 17b 中 ,如 期 望 那样 , 残 差 似乎 随机 地 分 布 
在 0 直线 周围 . 同时 , 对 二 次 模型 来 说 , 残 差 围绕 0 直线 的 变异 似乎 也 更 小 . 这 说 明 , 二 次 模型 对 预 
测 用 电量 提供 了 一 个 好 得 多 的 模型 . 

注 : 残 差分 析 验 证 了 例 11. 12 的 结论 , 在 那里 , 我 们 发 现 二 次 项 Bx? 是 统计 显著 的 . 

检查 模型 错误 指定 等 价 于 图 法 检验 假设 Ee) =0. 为 了 说 明 , 假定 E(y) 的 真实 模型 由 二 次 模型 

E(y) 2o * Bix +B>2 
给 出 ， 但 我 们 却 指定 了 一 阶 概率 模型 
y-Bo tBix +€ 

根据 我 们 的 模型 , 可 以 得 到 ， 

e =y- [B *fix] 
可 以 证 明 , 

E(e) =E(y) - [Bo * ix] 
代入 上 面 E(y) 的 表达 式 , 得 到 
E(e) 2 Bo * Bix * Box? - [Bo * Bix] 25x? 

35 x#0 Hf, E(e) 290. 因此 与 假设 E(e) =0 FA. 
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检测 不 相等 的 方差 

残 差 的 散 点 图 也 可 用 来 检查 不 变 的 误差 方差 假定 . 例如 ,关于 预测 值 了 的 残 差 图 可 能 如 图 11. 18 
所 示 的 那样 ,在 图 中 , 残 差 值 的 范围 随 的 增加 而 增加 . 这 表明 , 随 着 估计 的 均值 了 增 大 ,响应 变量 y 
的 方差 也 越 来 越 大 ,在 这 种 情况 下 , 我 们 说 误差 具有 异 方差 性 ， 

由 于 y 的 方差 常 依赖 于 y 的 均值 , 故 图 11. 18 ê 








所 示 类 型 的 残 差 图 并 不 是 罕见 的 . 代表 每 单位 面 SEIEN 

积 、 体 积 、 时 间 等 的 计数 ( 即 泊 松 随机 变量 ) F 

就 是 恰当 的 例子 ,对 泊 松 随机 变量 来 说 , y 的 方差 g| s. Q l or e 

等 于 E(y) =u, BI wy =u. 8 or* . S . . . ° 5 
因为 7 是 E(y) 的 一 个 估计 , 所 以 关于 了 的 残 oett e 

差 图 可 以 指出 残 差 ( 因而 o=, ) 的 范围 是 如 何 随 着 


E(y) 的 增加 而 变化 . 如 果 图 如 11. 9a 所 示 的 类 型 ， 
并 且 认 为 y 可 能 是 近似 的 泊 松 随机 变量 , 那么 用 图 11.18 说 明 y 的 方差 是 变化 的 残 差 图 
y* =YY( 代 蔡 y) 拟 合 自 变量 可 能 使 响应 的 方差 稳定 . 
同样 的 , 如 果 y 是 百分数 或 比率 5, 我 们 期 望 当 p 接近 0 或 1 时， z; = Vp-p, 而 当 p =0.5 
时 ,达到 最 大 值 . 这 种 数据 类 型 关于 了 的 残 差 图 如 图 11. 19b 所 示 . 为 了 稳定 这 类 数据 的 方差 , 拟 合 
y" =sin Wy, 其 中 yy 用 弧度 来 表示 . 

需要 方差 稳定 化 变换 的 第 三 种 情况 是 当 响应 变量 y 服从 乘法 模型 时 . 与 前 面 讨论 的 加 法 模型 不 
F, 在 这 个 模型 中 , 因 变 量 可 以 写成 它 的 平均 值 与 随机 误差 分 量 的 乘积 ; 

y=[E(y)] ` £ 

这 个 响应 的 方差 关于 均值 的 平方 成 比例 的 增长 , H Valy) = [E(y) 1202, Hf o? Re 的 方差 . 服从 
乘积 误差 的 数据 产生 的 关于 了 的 残 差 图 如 图 11. 19e 所 示 , 对 这 类 数据 合适 的 变换 是 y* =ln(y). 

将 已 经 讨论 的 三 种 方差 稳定 化 变换 总 结 在 表 11. 8 rh. 


A3: (y — $) 














a) 泊 松 b) 二 项 
图 11.19 泊 松 、 二 项 、 乘 法 响应 变量 的 关于 了 的 残 差 图 
表 11.8 稳定 化 响应 变量 方差 的 变换 





R 3t 图 数据 类 型 . 特 征 变 x 
如 图 11. 19a 所 示 泊 松 每 单位 时 间 、 上 距离 、 体 积 等 的 计数 y* = 他 
如 图 11. 19b 所 示 二 项 比率 、 百 分 比 或 固定 的 n 次 试验 中 成 功 次 数 y" =sin-1Yy, 其 中 y 是 比例 
如 图 11. 19e 所 示 乘积 商业 和 经 济 数据 y* =In(y) 
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表 11.9 是 50 位 土木 工程 师 样本 的 工资 y 与 工龄 x 的 数据 . 用 MINITAB 对 数据 拟 合 一 阶 
BUS E(y) =o * Byx. MINITAB 输出 如 图 11. 20 ,关于 了 的 残 差 图 如 图 11. 21 ,解释 这 个 结果 . 模型 需 
要 修正 吗 ? WERE, 该 怎么 做 ? 

表 11.9 例 11.14 的 工资 数据 


工龄 x( 年 ) 工资 Y( 美 元 ) 工龄 (年) 工资 y( 美 元 ) 工龄 x( 年 ) 工资 y( 美 元) 

















7 26 075 21 43 628 28 99 139 

28 79 370 .4 16 015 23 52 624 
23 . 65 726 24 65 644 17 50 594 
18 41 983 20 63 022 25 53 272 
19 62 308 20 47 780 26 65 343 
15 41 154 15 38 853 19 46 216 
24 53 610 25 66 537 16 54 288 
13 33 697 25 67 447 3 20 844 
2 22 444 28 64 785 12 32 586 
8 32 562 26 61 581 23 71 235. 
20 43 076 27 70 678 20 36 530 
21 56 000 20 51 301 19 52 745 
18 58 667 18 39 346 27 67 282 
7 22 210 1 24 833 25 80 931 
2 20 521 26 65 929 12 32 303 
18 49 727 20 41 721 11 38 371 
11 33 233 26 82 641 


# Ei 11.20 的 MINITAB 输出 表明 一 阶 模型 提供 很 了 这 些 数据 恰当 的 拟 合 . R = 0. 787 指出 模 
型 解释 了 工资 样本 变 差 的 78.7%. 

检验 B1 的 了 值 13.31 是 高 度 显著 (p 值 ~0), 说 明 模型 为 预测 y 提供 了 信息 . 然而 , 检查 残 差 关 
于 7 的 图 像 ( 图 11. 21) 揭 示 了 潜在 的 问题 , 残 差 变异 的 形状 呈 “ 圆 锥 " 形 ， 残 差 的 大 小 随 着 估计 的 平 
均 工资 的 增加 而 增加 . 





The regression equation is 
SALARY = 11369 + 2141 EXP 


Predictor Coef SE Coef T P 
Constant 11369 3160 3.60 0.001 
EXP 2141.4 160.8 13.31 0.000 
3 = 8642.44 R-Sq = 78.75 R-Sq(adj) = 78.25 


Ànalysis of Variance 





Source DF SS MS F P 
Regression 1 13239655469 13239655469 177.26 0.000 
Residual Error 48 3585206077 74691793 

Total 49 16824861546 








K 11.20 4511.14 ff] MINITAB 回归 输出 
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Residuals Versus the Fitted Values 
(response is SALARY) 


30000 


20000 


10000 





Residual 








10000 20000 30000 40000 50000 60000 70000 
Fitted Value 


E 11.21  f5| 11. 14 的 MINITAB 残 差 图 


残 差 图 指出 了 乘法 模型 的 可 能 性 , 建议 使 用 方差 稳定 性 变换 y* = ln(7y). 在 下 面 的 例子 中 , 进 一 
步 探 讨 这 种 可 能 性 . 
考虑 表 11. 9 中 的 工资 与 工龄 数据 . 利用 因 变 量 的 自然 对 数 变换 , 建立 ln(y) 和 工龄 x 之 
间 的 线性 模型 : 
In(y) 2Bo +Bix +£ 
a. 评估 模型 的 恰当 性 . 
b. f& FE B, 的 值 . 
解 a. 图 11.22 的 MINITAB 输出 给 出 了 50 个 测量 值 的 回归 分 析 . 预测 方程 为 : 
Íny =9.84+0.05x 
R R? 20. 864, 4838 Ho : 61 =0 的 7=17. 43 是 高 度 显著 (p 值 =0). 这 都 说 明 这 个 模型 对 于 预测 
ln(y) 有 显著 的 贡献 . 





The regression equation is 
LNSALARY = 9.84 + 0.0500 EXP 


Predictor Coef SE Coef T P 
Constant 9.84151 0.05636 174.63 0.000 
EXP 0.049979 0.002868 17.43 30.000 
8 = 0.154113 R-Sq = 86.4% R-Sq(adj) = 86.1% 


Analysis of Variance 


Source DF 53 MS F P 
Regression 1 7.2122 7.2122 303.66 0.000 
Residual Error 48 1.1400 0.0238 

Total 49 8.3522 











Kd 11.22 $11.15 对 数 模型 的 MINITAB 回归 输出 
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如 图 11. 23 所 示 的 残 差 图 表明 对 数 变换 使 误差 方差 稳定 ,圆锥 形 消失 , 随 平均 工资 的 增加 , 残 
差 没 有 明显 的 增加 趋势 . 因此 , 我 们 认为 用 对 数 模型 比 没有 变换 的 模型 推断 更 可 靠 . 


Residuals Versus the Fitted Values 
(response is LNSALARY) 








9.24 ° * °, 
* * * 
011 g .. . 
e * * ` 

- e 
S 001 3 š " * : ç 
$ M .. `. .. 
£ 0 . . . 











T T T T T T 
10.0 10.2 10.4 10.6 10.8 11.0 11.2 114 
Fitted Value 


Æ 11.23 $811. 15 对 数 模型 的 MINITAB £35 K] 


b. 因为 我 们 用 工资 的 自然 对 数 作为 因 变量 , 所 以 , B 估计 值 的 解释 与 先前 讨论 的 有 些许 不 同 . 
一 般 来 说 , 对 数 变换 模型 中 参数 B 表示 , 自 变量 每 增加 一 个 单位 时 , 因 变 量 增加 的 百分比 . 这 个 百 分 
比 的 变化 率 可 由 估计 值 的 反对 数 减 1， 即 eh - 19 而 得 到 , 例如 , 工龄 * 增 加 一 个 单位 ( 即 一 年 ) 工 
程 师 的 工资 变化 的 百分比 为 (e 计 -1) = (ea -1) =0.051. 因此 ， 我 们 估计 一 个 工程 师 每 增加 一 年 
工龄 , 工资 就 增加 5. 1%. 

检测 非 正 态 性 

当 在 实践 中 应 用 回归 分 析 时 ,关于 随机 误差 e 的 4 个 标准 回归 假定 中 ,se 服从 正 态 分 布 的 假定 

最 少 约束 的 . 也 就 是 说 , 与 正 态 性 假定 适度 的 偏离 , 对 统计 检验 、 置 信 区 间 和 预测 区 间 的 有 效 性 只 
fia, gto. 在 这 种 情况 下 , 我 们 称 回归 关于 非 正 态 性 是 稳健 的 . 然而 , 与 正 态 性 过 分 的 偏离 , 由 
回归 分 析 得 到 的 任何 推断 都 值得 怀疑 

5.6 节 的 方法 可 以 用 来 确定 数据 是 否 严 重 违背 了 正 态 性 假定 . 为 了 说 明 这 一 点 , 图 11.24 给 出 了 
例 11. 11 的 交互 作用 模型 的 n=36 个 残 差 的 MINITAB 直方 图 和 正 态 概率 图 . 可 以 看 出 , 分 布 是 山形 
的 并 且 具 有 合理 的 对 称 性 . 因此 , 对 这 个 回归 分 析 来 说 , 没有 严重 背离 正 态 性 假定 . 

当 检 测 到 随机 误差 项 的 非 正 态 性 时 , 常 可 用 表 11.7 列 出 的 变换 之 一 来 校正 这 种 非 正 态 性 . 例 
An, 残 差 的 相对 频数 分 布 (或 茎 叶 图 ) 高 度 向 右 偏 时 (这 通常 是 泊 松 数据 ), y 的 平方 根 变换 会 使 残 差 





O 这 个 结果 可 以 将 工资 y 的 百分比 变化 表示 成 (yy -yo)/yo 而 得 到 , 其 中 表示 当 , B x 51 时 的 y 值 ， yo 表示 当 x = 
0 时 的 y 值 . 令 y”=ln(y), 并 假定 对 数 模型 是 y* B, +B,x, WJ 
y=" -er 人 当 *=0 
eepl 当 x=1 
代入 , 我 们 有 


yi 一 yo eR — ee — eo 


=ef! -1 
Yo 
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的 方差 稳定 (近似 地 ) ,同时 也 会 降低 残 差分 布 的 偏 度 . 非 正 态 性 也 许 是 由 下 面 讨论 的 异常 值 引起 的 . 


Histogram of the Residuals 
Man-HRs) 





64 
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Normal Probability Plot of the Residuals 
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图 11.24 8 11. 11 交互 作用 模型 残 差 的 MINITAB 直方 图 和 正 态 概率 图 


检测 异常 观测 值 和 强 影响 观测 值 

残 差 图 也 可 用 来 检测 异常 值 , 即 看 起 来 与 模型 不 相符 的 y 值 . 因为 几乎 所 有 的 y 值 都 应 该 在 y 的 
均值 E(y) B) 3o 区 间 内 ， 所 以 , 我 们 也 期 望 绝 大 多 数值 在 了 的 3s 区 间 内 . 如 果 一 个 残 差 的 绝对 值 大 
于 3s, 我 们 认为 它 是 异常 值 , 并 寻找 可 以 解释 如 此 大 值 原因 的 背景 信息 . 

定义 11.3 绝对 值 大 于 3s 的 残 差 称 为 异常 的 . 

为 了 检测 异常 值 , 我 们 在 残 差 图 距离 0 轴 的 上 、 下 35 处 画 两 条 水 平 线 (参看 图 11.25) ， 落 在 这 
两 条 水 平 线形 成 的 带 形 域 之 外 的 任何 残 差 将 认为 是 异常 的 .然后 , 我 们 开始 研究 寻找 这 些 观测 值 与 
期 望 行为 偏离 的 原因 . 

尽管 有 些 分 析 人 员 认 为 , 不 论 什么 原因 都 应 剔除 这 些 p 
异常 值 ; 而 另外 一 些 人 则 认为 ,只 对 可 以 追踪 到 特殊 原因 | 
的 这 些 异常 值 修正 . 最 好 的 办 法 大 概 是 这 两 个 极端 之 间 的 
X. 例如 在 决定 删除 一 个 异常 值 之 前 , 必须 考虑 它 对 回 
归 分 析 造 成 了 多 大 程度 的 影响 ， 当 一 个 真正 的 异常 值 ( BD j 
不 是 由 记录 或 测量 错误 造成 的 异常 ) 对 回归 分 析 有 重大 影 
响 时 , 受到 怀疑 的 可 能 是 模型 而 不 是 异常 值 . 忽略 重要 变 1125 用 来 确定 异常 值 的 3s 线 


残 差 (y — $) 
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量 或 更 高 阶 项 , 都 可 能 是 造成 模型 不 能 很 好 地 预测 异常 值 的 原因 . | 

有 几 种 高 级 的 数值 方法 可 以 识别 有 异常 影响 的 观测 值 . 方法 之 一 是 每 次 删除 一 个 观测 值 , 基于 
其 余 n -1 个 观测 值 重新 拟 合 回归 模型 . 这 种 方法 是 根据 称 为 刀 切 法 9 的 统计 程序 , 刀 切 法 在 实践 中 
获得 越 来 越 多 的 认可 . 刀 切 法 应 用 于 回归 的 基本 原则 是 比较 用 个 观测 值 拟 合 的 回归 方程 结果 与 册 
除 第 ;个 观测 值得 到 的 回归 方程 结果 , 以 确定 一 个 特殊 观测 值 究竟 对 回归 分 析 产 生 了 多 大 程度 的 影 
响 . 使 用 刀 切 法 可 以 计算 几 种 不 同 的 影响 度量 . 

删除 的 残 差 d; =y; -7 了 (i;) , 度量 了 观测 值 y, 与 预测 值 fo 的 差 , (i) 是 由 删除 了 第 i 个 观测 值 所 
合 的 回归 模型 得 到 的 . (符号 (i) 一 般 表示 从 回归 分 析 中 删除 了 观测 值 y,). 具有 异常 大 (绝对 值 ) 删 
除 的 残 差 的 观测 值 认为 对 拟 合 模型 有 大 的 影响 . 

男 一 种 与 删除 的 残 差 密 切 相关 的 度量 是 由 个 观测 值 拟 合 得 到 模型 的 预测 值 与 删除 y, 时 拟 合 
得 到 模型 的 预测 值 ?(;) 之 差 , 即 方 -7 ， 当 这 个 差 值 相 对 于 预测 值 yx; 很 大 时 , 则 称 观测 值 y, 影响 回 
归 拟 合 . 

第 三 种 使 用 刀 切 法 识别 有 影响 观测 值 的 方法 是 对 于 模型 中 的 每 个 B 参数 , 计算 由 个 观测 值得 
到 的 参数 估计 与 由 -1 个 观测 值 (删除 受到 怀疑 的 观测 值 ) 得 出 的 参数 估计 之 差 . 例如 ,考虑 直线 
BUM E(y) =Bo +Bix. Æ Bo -Â 与 B -ÊP 度量 了 第 i 个 观测 值 对 参数 估计 的 影响 程度 . ( 用 前 
面 定义 的 (i) 符 号 , pf” 表示 当 分 析 中 删除 第 i 个 观测 值 时 系数 e 的 估计 值 )， 如 果 参 数 估计 值 有 大 
幅度 变化 , 即 差 的 绝对 值 很 大 , 则 认为 y, 是 一 个 有 影响 的 观测 值 . 

检测 误差 的 相关 性 

当 用 于 回归 分 析 中 的 数据 为 一 个 时 间 序 列 时 , 随机 误差 独立 (不 相关 ) 的 假定 常常 不 成 立 . 对 于 
时 间 序 列 数据 , 样本 中 的 试验 单位 是 依 相继 时 间 顺 序 的 时 段 (例如 年 、 月 或 天 ). 

对 于 大 多 数 商 业 和 经 济 时 间 序列 来 说 , 存在 回归 残 差 随时 间 有 正 的 或 负 的 游程 趋势 . 例如 ,对 
以 年 为 单位 的 时 间 序 列 数据 , 考虑 拟 合 直线 回归 模型 , 模型 的 形式 为 . 

E(y) =Bo * Bit 

其 中 y 是 关于 年 份 : 的 时 间 序列 值 . 年 残 差 图 可 能 呈现 图 11. 26 所 示 的 模式 ,注意 , 如 果 第 1 AE DUREE 
是 正 (或 负 ) 的 , 则 第 :+1 年 的 残 差 有 为 正 ( 或 负 ) 的 趋势 . 这 就 是 说 ,， 相 邻 的 残 差 具有 相同 符号 的 趋 
势 ,而 且 表现 出 相关 性 . 这 违背 了 误差 独立 的 假定 , 因而 由 此 模型 得 到 的 推 斯 受到 怀疑 . 
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图 11.26 年 时 间 序列 模型 的 残 差 图 





O 方法 的 名 称 取 自 于 男 童子 军 大 折 刀 ， 当 专 门 方法 不 能 使 用 时 , 刀 切 法 为 各 种 情况 提供 了 方便 的 工具 ， [参看 Belsley， 
Kuh, and Welsch(1980). ] 
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处 理 这 个 问题 的 方法 是 提出 一 个 包含 确定 性 分 量 和 随机 误差 分 量 的 复杂 时 间 序 列 模型 . 时 间 序 
列 模型 超出 了 本 书 的 范围 . 学 习 这 种 模型 的 更 多 内 容 参 考 本 章 的 参考 文献 . 


残 差分 析 步 又 总 结 

1. 通过 画 残 差 (y -7) 关于 模型 中 每 个 自 变量 的 残 差 图 检查 错误 指定 的 模型 . 检测 到 图 中 的 曲线 趋势 表明 变 
E x 的 二 次 项 可 能 改进 模型 的 恰当 性 . 

2. 通过 画 残 差 关于 预测 值 (7) 的 残 差 图 检查 方差 不 等 { 异 方差 ). 如 果 发 现 与 图 11. 19 中 之 一 相似 的 模式 ， 
则 对 y 用 合适 的 方差 稳定 化 变换 ( 见 表 11.7) ,然后 重新 拟 合 模型 . 

3. 通过 构造 残 差 的 茎 叶 图 (或 直方 图 ) 检 查 非 正 态 误差 ?. 如 果 发 现 数据 极度 偏 斜 ， 那 么 或 者 利用 表 11.7 中 
的 变换 , 或 者 寻找 一 个 或 多 个 异常 值 (看 第 4 步 ). 

4 在 关于 了 的 残 差 图 上 , 找 出 位 于 0 轴 上 下 距离 3s 或 更 大 的 残 差 检 查 异常 值 . 在 从 分 析 中 期 除 一 个 异常 
值 之 前 , 必须 进行 调查 以 确定 异常 值 的 原因 . 如 果 发 现 的 异常 值 是 由 于 编码 或 记录 错误 产生 的 ， 则 修 
正 或 删除 它 . 否则 ,在 删除 之 前 ,， 应 确定 异常 值 有 多 大 影响 . 影响 的 几 种 度量 都 适用 ,包括 删除 的 
ARE. 

5. 通过 时 间 上 顺序 的 残 差 图 来 检查 相关 的 误差 . 如 果 发 现 具 有 正 残 差 或 负 残 差 游程 ,提出 一 个 考虑 残 差 相 关 
性 的 时 间 序 列 模型 ， 












































应 用 练习 
11.40 ”解释 残 差 图 . 指出 下 列 残 差 图 中 的 问题 . 
° . ° . œ 3gp-—-—--------2-2-22222222. 
TN tos a tal | toto 
M °. ° >f A LLL LLLI 
x y x 
a) (y — 3) b) (y - $) c) (y - y) 
° . . t "M ° 
MEI g 
. -l ° ° ° E 
0 r t (0-5 
d)(y - $) e) 





O ”关于 正 态 性 的 假设 检验 (如 Shapiro-Wilk 检验 ) 在 大 多 数 统计 软件 包 中 可 以 得 到 . 然而 , 这 些 检验 在 下 列 意义 上 是 严格 
的 . 与 正 态 性 只 有 些许 偏离 的 数据 通常 被 检验 是 非 正 态 的 . 关于 这 些 检验 的 更 多 信息 ,参考 本 章 的 参考 文献 . 如 果 应 
HEN, 请 记 住 回 归 对 非 正 态 误差 具有 稳健 性 . 
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11.41 PCB 浓度 建 模 . PCB 组 成 一 族 危险 的 化 学 药 d. £5 c. 根据 定义 ,尽管 Boston Harbor 残 差 不 


m, 这 些 物 质 常 被 工厂 非法 丢弃 到 周围 的 小 溪 ， 大 是 异常 值 , 但 因为 它 的 很 大 y 值 ，EPA 认为 它 
河 或 海湾 . 在 下 表 中 记录 了 相继 两 年 从 37 个 美国 对 回归 产生 强 影 响 . 从 数据 中 删除 Boston Har- 
海湾 和 港湾 收集 的 水 样 中 年 PCB 浓度 ( 百 万 分 之 bor 观测 值 并 重新 拟 合 模型 ,模型 的 恰当 性 有 改 
—). 一 个 来 自 环境 保护 署 的 官员 想 建立 第 二 年 海 进 吗 ? 
湾 PCB 浓度 y 作为 前 一 年 PCB 浓度 x 的 函数 模型 . e. 另 一 种 方法 是 采用 自然 对 数 变换 y”= In(y + 
a. 对 数据 拟 合 一 阶 模型 Ely) 2B, + Bix, 并 给 出 最 1) ,x” zIn(x € 1), 并 拟 合 模型 B(y* ) = B + 
小 二 乘 预 测 方程 . Bix'. 拟 合 这 个 模型 ,然后 进行 模型 的 恰当 性 
b. 这 个 模型 是 否 适合 预测 因 变量 y? 请 解释 . 检验 , 完成 残 差分 析 , 解 释 结 果 , 特 别 评论 Bos- 
c. 构造 数据 的 残 差 图 , 你 能 发 现 异 常 值 吗 ? 如 果 ton Harbor 的 残 差 值 . 


能 , 请 指出 来 . 


PCB 浓度 PCB 浓度 























ud 州 第 一 年 第 二 年 ] "om 州 第 一 年 。 第 二 年 
Casco Bay ME 95. 28 77. 55 | Mississippi River Delta LA 34 30. 14 
Merrimack River MA 52.97 29.23 Barataria Bay LA 0 0 
Salem Harbor MA 533. 58 403. 1 San Antonio Bay TX 0 0 
Boston Harbor MA 17 104.86 736 Corpus Christi Bay TX 0 0 
Buzzards Bay MA 308. 46 192. 15 San Diego Harbor CA 422.1 531. 67 
Narragansett Bay RI 159. 96 220. 6 San Diego Bay CA 6.74 9.3 
East Long Island Sound NY 10 8.62 Dana Point CA 7. 06 5.74 
West Long Island Sound NY 234. 43 174.31 Seal Beach CA 46. 71 46. 47 
Raritan Bay NJ 443. 89 529.28 San Pedro Canyon CA 159.56 176.9 
Delaware Bay DE 2.5 130. 67 Santa Monica Bay CA 14 13. 69 
Lower Chesapeake Bay VA 51 39. 74 Bodega Bay CA 4.18 4. 89 
Pamlico Sound NC 0 0 Coos Bay OR 3.19 6.6 
Charleston Harbor SC 9.1 8. 43 Columbia River Mouth OR 8.77 6. 73 
Sapelo Sound CA . 0 0 Nisqually Beach WA 4. 23 4.28 
St. Johns River FL 140 120. 04 Commencement Bay WA 20.6 20.5 
Tampa Bay . FL 0 0 Elliott Bay WA 329.97 414.5 
Apalachicola Bay FL 12 11.93 Lutak Inlet AK 5.5 5.8 
Mobile Bay AL 0 0 Nahku Bay AK 6.6 5.08 


Round Island 
资料 来 源 ， Environmental Quality, 1987—1988. 


11.42 碳 硅 石 的 弹性 . 碳 硅 石 由 于 它 的 极端 硬度 而 







z(GPa)| 压缩 体积 y(%) 压强 x(GPa) 








压缩 体积 y(% ) 压强 
100 











成 为 一 种 受 欢 迎 的 研磨 材料 , 碳 硅 石 的 另外 一 个 重 0 85.2 31.6 
要 的 性 质 是 它 的 弹性 . Journal Applied Physics ( 1995 站 8 z M M ; so 1 
年 9 月 ) 研 究 了 这 种 材料 的 弹性 性 质 , 用 金刚 石 压 90.2 30.4 82.9 62.6 
腔 将 碳 硅 石 、 氧 化 钠 和 黄金 以 33 : 99 : 1 的 体积 比 Au 46 9 3.7 68,4 
例 压 缩 成 一 种 混合 物 . 测量 11 个 不 同 压强 ( GPa) 资料 来 源 : Bassett, W. A. , Weathers, M. S. , and Wu, T. C. 
下 压缩 的 混合 物体 积 y( 相 对 于 0 压强 时 的 ER), “Compressibility of SiC up to 68. 4 GPa. " Journal of Applied 


结果 列 在 表 中 . Physics, Vol.74, No.6, Sept. 15, 1993, 3825 页 ( 表 1) 
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a. 对 数据 拟 合 直线 模型 E(y) =b +Bix. 

b. 对 此 模型 计算 回归 残 差 . 

. ERF x 的 残 差 图 , 能 发 现 什么 趋势 吗 ? 

. 根据 c 的 残 差 图 提出 另 一 个 模型 . 

. 拟 合并 分 析 d 中 的 模型 . 

11.43 城市 空气 分 析 . 东京 都 立 大 学 的 化 学 工程 师 
分 析 城 市 空气 样品 中 存在 的 低 分 子 二 凑 酸 (Envi- 
ronmental Science and Engineering, 1993 年 10 H ). 
从 东京 市 区 收集 到 的 19 个 空气 样品 的 二 羧 酸 (全 
碳 量 的 百分比 ) 和 氧化剂 浓度 数据 列 在 表 中 ,考虑 
二 凑 酸 百分比 y 与 氧化 剂 浓度 x 之 间 的 直线 模型 ， 
进行 完整 的 残 差 分 析 . 

ZR 氧化 剂 浓度 


a a 


m 


二 羧 酸 氧化剂 浓度 
(%) (ppm) 


资料 来 源 : Kawamura, K., and Ikushima, K. “ Seaonal 
changes in the distribution of dicarboxylic acids in the urban 


Loo "LL NABNE T m | JEN 


14622 14252.043775 359.95522475 0.1855911418 0.85/5525828 0.4141457267 
13196 12527.865128 668.1338724 
11948  12303.859631  -355.8596307 
11289. 12038.477519 -749.4776187 
11964 12229.510458 -265.5104583 
10526 10680.392768 -154.3927685 
10387 10519.725593 -132.7255935 
10592 10367.641131  224.35886877 
10460 . 10566.32604 -106.3260395 
10085  10232.796563 -145.7965633 
14628  13214.015064 1413.9849358 
13396  12563.017765  832.98223507 
Du 11726  119632.551915 -237.5519147 
14 | 11252 11310.001708  -58.00170759 














E fh 12449 12087.066769 351.93323148 
L I» 11030 11313.295597 -283.2955965 

dr | 10787 11134.121881 -347.1218314 
L l _ 10603 .10982.776871 ，-379.7768706 
Log 10144 .10331.066242 -187.0662422 
L 59 | 11674 11509.933417 164.06658345 
LM | "13510  11025.244807 | 484.75519289 
LF 2 | 10946  10780.075894  155.92300575 


atmosphere. " Environmental Science & Technology, Vol. 27, 


No. 10, Oct. 1993. p. 2232, 从 图 4 中 抽取 的 数据 . 


11.44 ”田纳西 河 的 鱼 污染 . 参考 美国 陆军 工兵 部 队 


关于 位 于 亚 拉巴 马 州 田纳西 河岸 边 的 化 工 三 有毒 
排放 物 污染 鱼 的 数据 . 在 练习 11. 22 h, 拟 合 了 一 
阶 模型 E(y) =B + Box, +B2x +B;x3，, 其 中 y 是 捕 
捉 到 的 鱼 体 内 DDT 水 平 , x 是 捕捉 点 到 上 游 的 英 
E, x 是 鱼 的 身长 , x, 是 鱼 的 重量 . 对 这 个 模型 进 
行 完 全 的 残 差 分 析 ,你 认为 此 模型 需要 修整 吗 ? 请 
解释 . 


11.45 燃气 轮机 的 冷却 方法 . 参考 练习 11.21, 


Journal of Engineering for Gas Turbines and Power 
(2005 年 1 H) 对 燃气 涡轮 发 动机 的 高 压 注 雾 方 
法 的 研究 . 仍 考虑 热 消耗 率 y(kJ/kW - h) 作为 转 
E(x), 注入 温度 (> ) ,排出 气温 (xs ) ,转速 压 
JIE Cx, ) 和 空气 流量 比 (xs ) 的 函数 的 一 阶 模型 . 
文件 GASTURBINE 中 67 个 观测 值 的 影响 诊断 的 
SAS 表 列 后 面 . 解释 这 些 结果 ,你 发 现 有 影响 的 观 
测 值 吗 ?( 注 :“ 学 生化 ”删除 的 残 差 ， 即 删除 的 残 
差 除 以 它们 的 标准 误差 , 在 _RSTUDENT 列 中 给 
出 . 拟 合 值 之 间 的 差 了 - 55 EPI _DFFITS 中 给 
出 ). 


H RSTUDENT DFFITS 


090.095127258 31.5482334503 0.5019901643 
9.0519439392  -0.794131791  -0.185884543 
0.0521250193  -1.70373B164  -0.399535001 
0.0495908163.  -0.59039758 . -0.13486209 
0.0247893211  -0.338250917  -0.053930558 
0.0287913306  -0.291316918  -0.05015801 
0.0525537807 20.5019535902 0.1297738503 
9.0403612504 -0.234717477  -0.048136426 
0.0638701019  -0.328244987  -0.085739085 
9.0660538381 3.4645251575 0.9213652471 
0.056904056546 41.9095424681 0.4690542002 
0.080/47437b5  -0.535836461  -0.153106878 
0.0457271404 . -0.12835846  -0.028097989 
0.097947432b  0.8284045229 0.2729751205 
0.0625950725  -0.5345B402  -0.153981777 
0.0530684167  -0./748894899 -0.183444267 
0.0503576289  -0.851959048  -0.215925289 
0.0480282163 | -0.415017328  -0.093218567 
0.0509387171 .0.3544294875  0.0844287547 
0.0894655353 1.115553658  0,3707461139 
0.0278153559 0.393641431984 0.0615953835 


练习 11.45 的 SAS 输出 
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eu 
10604 
10270 
. 10529 
10350 
14796 
12913 
12270 
11842 
10656 
11360 
11136 
10814 
13523 
11289 
11183 
10351 
3722 
10481 
9812 
9669 
9643 
9115 
9115 


10888 
9738 
9295 
9421 
3105 

10233 

10186 
9918 
3209 
9532 
9933 
9152 
3235 

16243 

14628 

12766 
8714 
9459 

11348 

12414 





11.46 家具 销售 . 下 表 中 数据 是 4 个 城市 的 家 具 出 口 


-11358. 


11588 





10705 .096399 - 
10896 .236335 

10345.90378 
10593.014477 
10618.441095 
14708.018722 
12831.983127 
12673.365781 
12254 869917 
11663.002778 
11218 
11197.799982 
12489.538273 
11159.830604 


11020.912821 


11690.398363 


.10114.049783 


10541.142037 
9972.0182951 
3353.4134851 
9748. 8383688 
8325.4058325 
3117.0677296 
10532.975758 
16500.011954 
3935.8913064 


,8909,4259476 


9412.80509085 
8582.8087155 
9732. 5653104 


10365.872705 
9659.626414 


9515.4158984 
9638.1825427 
10280.590042 
8894.7720107 


9640.0725037 


15757.951033 
15114.912042 
13140.94411 


.8415.2383967 | 
9760.4835859 ， 


11751,375827 
12704.255015 





.425759 


539343. 


-197.0963395 
-292.2363354 
-75. 90377957 
-64 .01447678 
-258.4410951 
87.381278035 
21.016872703 
-403.3657807 
-412.8699173 


-1007 .002778 
141.57424065 
-61.79998173 


~542.6393433 
1033.4617267 
129.16939627 


162.08717923 


-739.3983628 
-$92 0497828 
-60.14203715 
-160.0182951 
-290.4134861 
-105 , 8383688 
789.59416751 
-~2.067729619 
1055.0232421 

387 . 9880461 
-197.8913064 
385. 57405239 

8. 194991357 
522, 19128447 
500.43468958 
-179.8727048 
258.37358604 
“=306.4158984 
-106.1825427 

-947.5900416 
25f.22798934 
-345.0725037 
485. 04896726 
486.9120421 

/7874.9441104 
'298.76150334 


, 196.02417311 
-290.2560146 


-291.4835859 


0. vum 
0.0513484931 
0.0360856225 
0.0644165255 
0.0815098668 
0.1196385964 
0.1248270761 
0.0365598218 
0.0444523577 
0.0833329646 
0.0616396938 


0.0564808302 


0.0424252255 
0.1808345787 
0.0537139524 
0.0922202447 

0.043185789 
0.0745533047 
0.0880224842 
0.0503975323 
0.1395029404 
0.0783958802 
0.1527764312 
0. 1988637759 
0. 1136884575 
0.0913012389 
0.0802504304 
0.0765052121 
0.0739287313 
0.1360909184 
0.1101355734 

0, 090892499 
0. 0480920098 
0. 0445866186 
0.0647075576 
0.0512493612 
0.0812541489 
0.0635095373 

0.288575505 
0.2045952179 
0.0823489349 
0.5520390072 
0.1177328552 
0.1803903839 
0.067064899 


练习 11.45 的 SAS 输出 ( 续 ) 


销售 量 y( 千 美元 / 周 ). 目标 是 建立 一 个 以 销售 量 y 作 


为 交通 流量 、 由 于 城市 大 小 或 其 他 市 场 条 件 引 起 的 城 


-0.434428773 
-0.650831939 
-0.167149718 
-0.143077515 
-0.584544836 
0.2027537434 
0.0485612744 
-0.894173101 
-0.919363731 
-2.378187485 
0.3161704598 
-0.137544055 
-1.213244202 
2.6038547325 
0.2872150154 
0.368136372 
-1.871507351 
-0.886650757 
-0.136148709 
-0.355316634 
-0.679307097 
-0.238416847 
1.9097622284 
-0.004993454 
2.5502108124 
0.8854991793 
-0.441963917 
0.8727508315 
0.018407208 
1.2295887723 
1.1594647716 
-0.408238798 
0.5739844118 
-0.680211734 
-0.237434446 


-0.775203502 


0.5817040777 
-0.777122543 

1.259441918 
-1.194032875 

-0.85112564 
0.9724353283 
-0.873300499 
0.4688783032 
-0.551850908 


445 
(4) 
— | Rsp | H | HsTWENT | FE 


-0 . 083067452 
70.151418655 
-0.0323410065 
-0.037542982 
-0.17413484 
0.0747436047 
0.0183399243 
=0. 174185203 
-0 . 198316893 
-0.717048776 
90.0810338947 
-0 . 033652474 
-0. 255372399 
1. 2234090394 
0. 0684288872 


0.1173360912 
-0.355111643 
-0.251657764 
-0.042297848 
-0.081855763 
-0.273515253 
-0.069536265 
0.8109768659 
-0.002487859 
0.9133581089 
0.2806832718 
-0.11190792 
0.2511993774 
0.0052008285 
0.48802317 
0.4079053895 
-0.129115103 
0.1290146639 
-0.146943618 
-0.062452168 
-0.180170595 


. 0. 1729924544 


-0.212400602 
0.8023229754 

-0.60557777 
-0.254957245 
1.0795071223 

-0.24595517 
0.2199702059 
-0.174771332 


市 间 变 异 的 调整 为 自 变量 的 函数 模型 . 模型 是 : 


E(y) 2 y * Byxi *Bix, + Bax, + Bax, 


其 中 : 
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Ë 若是 城市 1 a. 模型 对 预测 y 统计 有 用 吗 ? 请 解释 . 
x, = ` 
0 否则 b. 你 发 现 异常 值 了 吗 ? 
Ë 若是 城市 2 c. 参考 b, 在 残 差 图 中 发 现 的 异常 值 是 有 影响 的 观 
X, = N 
o 否则 测 值 吗 ? 
Ë 若是 城市 3 d. 注意 , HEE y 的 第 13 个 观察 值 在 输入 电脑 时 
%3 = 、 
0 否则 被 错误 地 输 为 82.0, 而 正确 值 为 8. 2. 改正 并 重 
x, = 交通 流量 新 进行 回归 分 析 ,解释 结果 . 
回归 分 析 的 SAS 结果 列 在 下 面 . 
The REG Procedure 
Model: MODELT 
Dependent Variable: v 
Number of .Übservations Read 24 
Number of Observations Used 24 
finalysis of Variance 
Sum of Mean 
Source DF Squares Square F Value Pr >F 
Model 4 1469.76287 357.44072 1.66 0.1936 
Error 19 41934.22571 220.74877 
Corrected Total 23 5663.98958 
Hoot HSE 14.85762 R-Square 0.2595 
Dependent Mean 9.07083 fidj R-Sq 0.1036 
Coeff Var 163.79550 
Parameter Estimates 
Parameter Standard 
Variable DF Estimate Error t Value Pr > iti 
Intercept 1 -15.45925 13.15400 -1.25 0.2264 
x1 1 1.10509 8.42257 0.13 0.8959 
x2 1 6.14277 11.67997 0.53 0.6050 
x3 1 14.48352 9.28833 1.56 0.1353 
x4 1 0.365287 0.16781 "2.16 0.0437 
Dutput Statistics 
Dependent Predicted Std Error Std Error Student Cook's 
Dbs Variable Value Mean Predict Residual Residual Residual -2-1 0 12 D 
1 8.3000 6.1652 4.9535 0.1348 14.008 0.00962 ! i ! 0.000 
2 6.6000 B.5281 4.9596 0.0719 14.005 0.00513 | i ' 0.000 
3 7.6000 14.4387 6.3195 -6.8387 13.447 -0.509 | *| i 0.011 
4 3:0000 -3.6324 6.6491 5.6324 13.287 0.499 | i i 0.012 
5 9.5000 20.2084 8.2476 -10.7084 12.358 -0.856 | *i ' 0.067 
6 5.9000 4.2783 5.0130 1.6217 13.986 0.115 | i i 0.000 
7 6.1000 4.3871 5.0054 1.7129 13.989 0.122 | i i 0.000 
8 5.0000 3.2622 5.1089 1.7378 13.952 0.125 | i i 0.000 
9 3.6000 -2.0357 6.1807 5.8357 13.511 0.417 | i l 0.007 
10 2.8000 -1.7527 9.1137 4.5527 11.734 0.388 | | H 0.018 
11 6.7000 10.5850 8.9723 -3.8850 11.843 -0.328 | i i 0.012 
12 5.2000 5.8677 8.5897 -0.6677 12.123 -0.0551 | i i 0.000 
13 82.0000 25.5352 7.2703 55.4538 12.957 4.358 | peo] 1.1965 
14 5.0000 15.5571 5.6157 -10.5571 13.755 -0.767 | xj i 0.020 
15 3.9000 13.0533 5.7339 -9.1533 13.707 -0.668 | *1 I 0.016 
16 5.4000 17.0812 5.6598 -11.6812 13.737 -0.850 | *i i 0.025 
1? 4.1000 12.9082 5.7479 -8.8082 13.701 -0.643 | *i I 0.015 
18 3.1000 8.7714 5.4338 -5.6714 13.392 -0.423 | i i 0.008 
19 5.4000 15.9926 5.6193 -10.5926 13.754 -0.770 | *1 i 0.020 
20 8.4000 10.0668 6.7066 -1.6668 13.258 -0.126 | ! i 0.001 
21 9.5000 13.0423 T.0271 -3.5423 13.091 -0.271 i I ! 0.004 
22 8.7000 9.8128 6.6916 -1.1128 13.265 -0.0839 | H i 0.000 
23 10.6000 15.6187 7.5002 -5.0187 12.826 -0.391 | ! i 0.010 
24 3.3000 78.0405 9.9965 11.3406 10.992 1.032 | Halad ' Ml 





练习 11. 46 的 SAS 输出 
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Dutput Statistics 

Hat Diag Cov  ------------------- DFBETAS------------------- 

Obs RStudent H Ratio DFFITS Intercept xi x2 x3 x4 

1 0.009366 0.1112 1.4742 0.0033 -0.0001 0.0020 0.0000 0.0000 0.0001 

2 0.004998 0.1114 1.4747 0.0018 -0.0001 9.0011 0.0000 0.0000 0.0001 

3 -0.4984 0.1809 1.4939 -0.2342 0.1256 -0.1339 -0.0539 -0.0510 -0.1455 

4 0.4891 0.2003 1.5339 0.2447 0.1410 0.0780 -0.0604 -0.0572 -0.1633 

5 -0.8606 0.3081 1.5482 -0.5743 0.3965 -0.2848 -0.1700 -0.1609 -0.4592 

5 0.1129 0.1138 1.4735 0.0405 0.0054 0.0224 -0.0023 -0.0022 -0.0063 

T 0.1132 0.1135 1.4724 0.0427 0.0053 0.0237 -0.0023 -0.0022 -0.0062 

8 0.1213 0.118) 1.4799 0.0444 0.0094 0.0234 -0.0040 -0.0038 -0.0108 

9 0.4079 0.1731 1.5134 0.1856 0.0964 0.0680 -0.0413 -0.0391 -0.1116 

10 0.3791 0.3763 2.0190 0.2945 0.0859 -0.0178 0.1667 -0.0348 -0.0995 

11 -0.3202 0.3547 2.0048 -0.2426 0.0614 -0.0127 -0.1967 -0.0249 -0.0711 

12 -0.0536 0.3342 1.9667 -0.0380 0.0017 -0.0004 -0.0286 -0.0007 -0.0020 

13 179.3101 0.2394 0.0000 100.6095 -55.1618 11.4109 23.6508 59.3701 63.8990 

14 -0.7589 0.1429 1.3061 -0.3098 -0.0000 -0.0000 0.0000 -0.1873 0.0000 

15 -0.5578 0.1489 1.3673 -0.2752 -0.0480 0.0099 0.0206 -0.1435 0.0556 

16 -0.8439 0.1451 1.2625 -0.3477 0.0374 -0.0077 -0.0160 -0.2237 -0.0433 

17 -0.6327 0.1497 1.3806  -0.2654 -0.0489 0.0101 0.0209 -0.1370 0.0566 

18 -0.4141 0.1875 1.5381 -0.1990 -0.0838 0.0173 0.0359 -0.0710 9.0971 

13 -0.7616 0.1430 1.3049 -0.3111 0.0096 -0.0020 -0.0041 -0.1919 -0.0112 

20 -0.1224 0.2038 1.6389 -0.0619 -0.0237 0.0469 0.0318 0.0409 -0.0084 

2i -0.2639 0.2237 1.6557 -0.1417 -0.0278 0.0974 0.05931 0.0797 -0.0461 

22 -0.0817 0.2028 1.6408 -0.0412 -0.0164 0.0314 0.0215 0.0276 -0.0049 

23 -0.3824 0.2548 1.6888 -0.2236 -0.0104 0.1378 0.0743 0.1054 -0.1037 

24 1.0336 0.4527 1.7945 0.3400 0.9216 -0.6183 -0.6154 -0.6930 -0.7023 

练习 11. 46 的 SAS 输出 ( 续 ) 
城市 交通 流量 ( 千 辆 ) 每 周 销售 量 y( 千 美元 ) 城市 交通 流量 ( 千 辆 ) 每 周 销售 量 y( 千 美元 ) 

1 59.3 6.3 3 75.8 8.2 
1 60.3 6.6 3 48.3 5.0 
1 82.1 7.6 3 41.4 3.9 
1 32.3 3.0 3 52.5 5.4 
1 98.0 9.5 3 41.0 4.1 
1 54.1 5.9 3 29.6 3.1 
1 54.4 6.1 3 49.5 5.4 
1 51.3 5.0 4 73.1 8.4 
1 36.7 3.6 4 81.3 9.5 
2 23.6 2.8 4 72.4 8.7 
2 57.6 6.7 4 88.4 10.6 
2 44. 6 5.2 4 23.2 3.3 


11.47 生产线 故障 . 制造 钢 饶 的 机 器 出 现 故障 时 何 
出 的 代价 是 很 大 的 . 故障 越 多, EKARRI, 
公司 盘 利 就 越 少 . 为 了 预计 盈利 损失 , REI gm 
营 者 希望 建立 一 个 模型 来 预测 生产 线 故障 数 ,公司 
统计 员 提 出 的 一 个 模型 是 : 

y=Bo *Bix; +B,x; t Bx, + B,x, +E 


其 中 y 是 每 8 h 班 制 生产 线 上 的 故障 数 . 


= 人 如 果 是 下 午 班 
' lo 否则 
. -{ 如 果 是 夜班 
” |o 否则 


^S 是 工厂 的 温度 (下 ) , x, 是 生产 线 上 工作 的 新 手 
人 数 . 用 最 小 二 乘法 拟 合 模型 后 , 附 图 中 画 出 了 关 
于 3 的 残 差 图 . 





a. 发 现 残 差 图 的 模式 了 吗 ? 这 对 于 最 小 二 乘 假定 
表明 什么 ? 

b. 给 出 响应 变量 y 以 及 a 中 发 现 的 模式 性 质 . 建议 
模型 做 怎样 修正 呢 ? 


0-5 
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11.11 某 些 陷阱 : 可 估 性 、 多 重 共 线性 和 外 推 


当 对 某 个 响应 y 建立 预测 模型 时 应 意识 到 一 些 问题 , 本 节 将 讨论 最 重要 的 几 点 . 

问题 1: 参数 的 可 估 性 
假定 想 拟 合 联系 一 种 新 型 塑料 配件 强度 y 与 浇铸 温度 x 的 模型 ,我 们 提出 一 阶 模型 

E(y) =Bo *Bix 

现在 , 假定 我 们 在 3007F FUE AE 3 个 塑料 配件 样本 , 数据 如 图 11.27 Bros , 可 以 看 到 以 下 的 问题 : 当 
所 有 数据 都 集中 在 一 个 x 点 时 , 不 能 估计 直线 的 参数 ,因为 拟 合 一 条 直线 需要 两 个 点 (x 值 ). 因此 ， 
当 只 观测 一 个 * 值 时 , 参数 不 能 估计 . 

如 果 我 们 仅 观 测 1 个 或 2 个 不 同 的 x 值 , 对 这 样 的 数据 集 , 要 拟 合 二 阶 模型 

E(y) =Bo + Bix * Box? 

会 发 生 类 似 的 问题 ( 见 图 11.28). 因为 用 二 阶 模型 拟 合 一 个 数据 集 之 前 ( 即 所 有 3 个 参数 被 估计 之 
前 ) 应 至 少 观测 3 个 不 同 的 x 值 . 一 般 地 , 要 求 * 的 水 平 数 必须 至 少 比 多 项 式 的 次 数 多 1. 而 且 记 住 ， 
顾及 到 估计 o? 的 自由 度 , 样本 容量 n 必须 足够 大 . 

















y i ° 
? de 
del ° ia 
E ° 
L MM 
—// 3 mx 0 7/ 27) 400 
Deis HEC) Ue ird SEC F) 
图 11.27 塑料 强度 和 浇铸 温度 数据 图 11.28 仅 有 2 个 x 的 观测 值 一 一 二 阶 模型 不 是 可 估 的 
拟 合 p 阶 多 项 式 回归 模型 的 要 求 


E(y) -By * Bix * Box! e +B, 
l. x 的 水 平 数 必须 大 于 或 等 于 (p+1). 
2. 样本 容量 nn 必须 大 于 p+1 以 允许 有 足够 的 自由 度 来 估计 o. 


因为 许多 被 观测 变量 实际 上 不 能 由 研究 者 控制 , 对 自 变量 的 观测 几乎 总 达到 足够 的 水 平 数 , 使 
得 允许 估计 模型 参数 . 然而 ， 当 所 用 的 计算 机 程序 突然 拒绝 拟 合 模型 时 , 问题 可 能 是 不 可 估 的 参数 . 

问题 2 : 参数 解释 

已 知 模型 中 的 参数 是 可 估 的 , 正确 地 解释 参数 估计 值 很 重要 . 一 个 典型 的 理解 错误 是 ,有 ;总 是 度 
E x 对 E(Y) 的 影响 , 与 模型 中 的 其 他 自 变 量 x 无 关 . 这 对 某 些 模型 来 说 可 能 是 对 的 , 但 一 般 来 说 不 
成 立 ( 例 如 11.8 节 中 的 交互 作用 模型 ). 一 般 地 , 随 着 模型 变 得 越 复 杂 , 对 单个 B 参数 的 解释 越 困 
XE. 在 12 章 中 , 我 们 会 对 许多 不 同 的 多 重 回 归 模 型 给 出 B 的 解释 . 

关于 参数 估计 的 另 一 个 错误 理解 是 , Bri SERI B; 值 建 立 了 E(y) 与 x; 的 因果 关系 . 也 就 是 说 ， 











多 重 回归 分 析 449 





MERR Â 显著 大 于 0, 那么 一 些 实际 工作 者 将 推断 x; 的 增加 引起 平均 响应 E( y) 的 增加 . 然而 在 
10.7 节 中 警告 过 , 推断 两 个 变量 之 间 的 因果 关系 是 危险 的 . 因为 也 许 有 许多 其 他 自 变量 (其 中 的 一 
些 可 能 已 经 包括 在 模型 中 , 而 另 一 些 可 能 忽略 了 ) 影 响 平 均 响应 , 除非 我 们 能 够 控制 其 他 变量 值 . 否 
MJ, 我 们 不 能 确定 观测 到 y 增加 的 真正 原因 是 什么 . 在 13 章 中 , 我 们 介绍 试验 设计 的 概念 ,这 里 的 自 
变量 值 是 在 观测 y 值 之 前 事先 设置 的 . 只 有 这 样 的 试验 , 才能 建立 因果 关系 . 

问题 3: 多 重 共 线性 

在 E(y) 模 型 中 , 常 有 两 个 或 更 多 自 变量 贡献 多 余 的 信息 ,也 就 是 说 , 自 变量 之 间 存 在 相关 性 . 例 
An, 假定 要 建立 一 个 模型 预测 卡车 的 汽油 里 程 等 级 y, 作为 载重 与 引擎 马力 x, 的 函数 . 一 般 来 说 ， 
载重 量 越 大 , 要 求 引擎 马力 越 大 , 导致 汽油 里 程 等 级 降低 . 因此 , 尽管 x ,xz 都 对 预测 汽油 里 程 等 级 
做 出 了 贡献 ， 但 有 一 些 信息 重合 了 ， 因为 X1 和 X 是 相关 的 . 

当 自 变量 相关 时 , 我 们 说 存在 多 重 共 线 性 . 实际 上 , 观察 到 自 变 量 之 间 的 相关 性 是 普遍 的 . 然 
而 , 当 在 回归 分 析 中 存在 严重 的 多 重 共 线性 时 , 会 引起 一 些 问题 . 

定义 114 多重 共 线 性 存在 于 回归 模型 中 有 两 个 或 多 个 自 变 量 相关 时 . 

首先 , 自 变量 之 间 的 高 度 相关 在 B 估计 、 标 准 误差 等 的 计算 中 增加 了 伟人 误差 的 可 能 性 2. 其 
次 , 可 能 引起 回归 结果 的 混乱 和 误导 . 

为 了 说 明 这 一 点 , 如 果 用 汽油 里 程 等 级 模型 

E(y) =Bo *Bixi * Box; 
拟 合 一 个 数据 集 , 我 们 发 现 启 B, (最 小 二 乘 估计 ) 的 + 值 都 不 显著 . 然而 , 对 假设 本 : B 28; =0 的 
检验 可 能 高 度 显著 . 这 些 检 验 看 起 来 矛盾 , 但 实际 上 并 不 矛盾 . 了 检验 表明 , 不 考虑 另 一 个 变量 
x2 = 马力 (因为 x 也 在 模型 中 ) 的 影响 , 变量 x1 = 载重 量 的 贡献 不 显著 . 另 一 方面 , 亚 检 验 的 显著 性 
告诉 我 们 , 两 个 变量 中 至 少 有 一 个 对 y 的 预测 ( 即 或 者 p, , p, 或 者 两 个 同时 不 等 于 0) 做 出 了 贡献 
事实 上 , 二 者 可 能 都 有 贡献 ,只 是 一 个 贡献 与 另 一 个 重 迭 了 . 

多 重 共 线 性 也 可 能 对 参数 估计 值 的 符号 产生 影响 . 更 确切 的 说 , B; 的 值 可 能 有 与 预期 相反 的 符 
=. 例如 , 在 汽油 里 程 等 级 模型 中 , 预期 两 个 参数 估计 值 的 符号 都 是 负 的 , 然而 模型 的 回归 分 析 结 果 
也 许 是 有 =0.2, B, = -0.7. B, 的 正 值 似乎 与 我 们 的 预期 ( 较 大 的 载重 量 会 降低 汽油 里 程 等 级 ) 巴 
JE. 然而 ， 当 自 变 量 相关 时 ,解释 有 系数 是 危险 的 ,因为 自 变 量 贡献 了 多 余 的 信息 , Bi 只 是 部 分 地 度 
HET HORE (Gs ) 对 汽油 里 程 等 级 的 影响 . 同样 , 在 问题 2 的 讨论 中 , 我 们 警告 不 能 基于 观测 数据 ( 自 
变量 的 值 不 能 控制 的 数据 》 建立 y 和 预测 变量 之 间 的 因果 关系 . 企图 解释 Bi 的 值 , 事实 上 正在 尝试 
EA yA x, 的 因果 关系 (由 于 重 的 载重 量 x1 将 引起 较 低 的 汽油 里 程 等 级 的 建议 ). 

如 何 避 免 回归 分 析 中 的 多 重 共 线性 问题 ? 一 种 方法 是 进行 试验 设计 使 得 变量 x 的 水 平 是 不 相关 
的 . 遗憾 的 是 ,时 间 和 费用 的 限制 可 能 妨碍 用 这 种 方法 收集 数据 . 由 于 各 种 各 样 的 原因 , 科研 中 收集 
的 大 多 数 数据 都 是 观测 数据 . 因为 观测 数据 常常 由 相关 的 自 变量 组 成 , 需要 诊断 多 重 共 线性 什么 时 
候 存 在 ,如 果 有 必要 , 修改 回归 分 析 . 

有 多 种 方法 可 以 发 现 回归 中 的 多 重 共 线 性 , 一 种 简单 的 方法 是 计算 模型 中 每 对 自 变 量 之 间 的 相 
关系 数 ", 用 10.7 节 的 方法 检验 正 相关 性 或 负 相关 性 , 如 果 有 一 个 或 多 个 + 值 显著 不 为 0, 则 讨论 的 





O 这 个 结果 是 由 于 事实 : 当 存在 严重 的 多 重 共 线性 时 , HAERE XX (DUE PIER ERE. 
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变量 是 相关 的 ,， 且 可 能 存在 严重 的 多 重 共 线性 Q. 多 重 共 线 性 存在 的 其 他 迹象 包括 上 面 提 到 的 , 即 当 
整体 模型 恰当 性 的 下 检验 显著 时 , 单个 B 参 数 的 了 检验 不 显著 ， 以 及 参数 估计 的 符号 与 预期 相反 @. 
下 面 框 格 归纳 了 检测 多 重 共 线 性 的 方法 ,在 例 11. 16 中 将 阐述 这 些 统计 量 的 使 用 . 


检测 回归 模型 中 的 多 重 共 线性 
E(y) =B; +B, x, t]x, + +B,x, 





多 重 共 线 性 的 指示 器 如 下 ; 

l. 模型 中 自 变量 对 之 间 显 著 相关 . 

2 ， 当 整体 模型 恰当 性 H,: B =B =…= 有 ,=0 的 屎 检验 显著 时 ， 单个 B 参数 的 了 检验 不 显著 . 
3. 估计 的 参数 有 (与 预期 ) 相反 的 符号 . 


美国 联邦 贸易 委员 会 (FTC) 每 年 根据 焦油 、 尼古丁 、 一 氧化 碳 的 含量 对 国内 烟草 排名 ， 
美国 调查 机 构 一 般 认为 这 三 种 物质 的 每 一 种 对 吸烟 者 的 健康 都 有 害 . 过 去 的 研究 表明 , 香烟 的 焦油 
和 尼 主 丁 含量 的 增加 通常 伴随 着 烟雾 释放 一 氧化 碳 的 增加 , 表 11. 10 列 出 了 今年 测试 的 25 个 (过 滤 ) 
品牌 样本 中 焦油 、 尼古丁 、 一 氧化 碳 合 量 (mg) 与 重量 (g) 的 数据 ,假定 要 建立 一 氧化 碳 含量 y 作为 焦 
油 含量 x1 、 尼古丁 含量 x, 与 重量 x 函数 的 模型 ， 用 模型 
E(y) 2 Bo * Bix, * Bx; * 3x4 

拟 合 表 11. 10 中 25 个 数据 . SAS 的 部 分 输出 结果 如 图 11.29 所 示 ， 检查 输出 结果 , 发 现 多 重 共 线 性 
的 迹象 了 吗 ? 

















表 11.10 例 11.16 的 FTC 香烟 数据 












焦油 (x1) BET) ”重量 (2 ) 一 氧化 碳 含量 (7) 焦油 (x1) ”尼古丁 (和 如) — ERG) 一 氧化 碳 含量 (7) 
14. 1 0. 86 0. 9853 13.6 11.4 0. 78 1. 1240 10.2 
16.0 1. 06 1. 0938 16.6 9.0 0.74 0. 8517 9.5 
29.8 2.03 1. 1650 23.5 1.0 0. 13 0. 7851 1.5 
8.0 0.67 0. 9280 10.2 17.0 1.26 0. 9186 18. 5 
4.1 0. 40 0. 9462 5.4 12.8 1.08 1. 0395 12. 6 
15. 0 1. 04 0. 8885 15.0 15.8 0. 96 0.9573 17.5 
8.8 0.76 1. 0267 9.0 4.5 0. 42 0. 9106 4.9 
12.4 0. 95 0. 9225 12.3 14.5 1.01 1. 0070 15.9 
16.6 1.12 0. 9372 16.3 7.3 0.61 0. 9806 8.5 
14.9 1.02 0. 8858 15.4 8.6 0. 69 0. 9693 10.6 
13. 7 1.01 0. 9643 13.0 15.2 1.02 0. 9496 13.9 
15.1 0. 90 0. 9316 14.4 12.0 0. 82 1. 1184 14.9 








7.8 0. 57 :0. 9705 10.0 
资料 来 源 : Federal Trade Commission. 


记 住 r 仅 度量 变量 x 之 间 的 成 对 相关 性 . 三 个 变量 Xi Xa, 33 作为 一 组 可 能 是 高 度 相关 的 ， 但 也 许 并 没有 较 大 的 成 对 
相关 性 . 因此 ， 当 所 有 成 对 变量 之 间 的 相关 系数 不 是 显著 不 为 零 时 ， 仍 可 能 存在 多 重 共 线性 . 

”检测 多 重 共 线 性 的 正式 方法 有 许多 ， 如 方差 扩大 因子 (VIF) , 具有 10 或 以 上 VIF 的 自 变 量 认 为 与 模型 中 的 一 个 或 多 个 
其 他 自 变量 高 度 相 关 . VIF 的 计算 超出 了 本 入 门 教材 的 范围 ,关于 VIF 和 其 他 检测 多 重 共 线 性 的 讨论 查阅 本 章 参考 
文献 . 
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Dependent Variable: CO 
Number of Observations Read 25 
Number of Observations Used 25 
finalysis of Variance 


Sum of Mean 


Source DF Squares Square F Value Pr >F 
Model à 3 495.25781 165.08594 78.98 «.0001 
Error 21 43.89259 2.09012 
Corrected Total 24 539.15040 

Root MSE 1.44573 R-Square 0.9186 

Dependent Mean 12.52800 fidj R-Sq 0.9070 

Coeff Var 11.53996 


Parameter Estimates 


Parameter Standard Var iance 
Variable DF Estimate Error t Value Pr > iti Inflation 
Intercept 1 3.20219 3.46175 0.93 0.3555 0 
TñR 1 0.96257 0.24224 3.97? 0.0007 21.63071 
NICOTINE 1 =2.63166 3.90056 -0.67 0.5072 21.89992 
HEIGHT 1 -0.13048 3.88534 -0.03 0.9735 1.33386 


Pearson Correlation Coefficients, N - 25 
Prob > iri under H0: Rho-0 


TAR NICOTINE HEIGHT 

TAR 1.00000 0.97661 9.49077 

«.0001 0.0127? 

NICOT INE 0.97551 1.00000 0.50018 

«.0001 0.0109 

HEIGHT 0.49077? 0.50018 1.00000 
0.0127 0.0109 











图 11.29 $811.16 一 氧化 碳 含量 模型 的 SAS 输出 


解 首先 , 注意 整体 模型 恰当 性 的 严 检 验 高 度 显著 ,检验 统计 量 ( 严 =78. 98) 和 观察 的 显著 性 水 
平 (p 值 <0. 0001) 着 重 显示 在 SAS 输出 中 . 因此 , 可 以 得 出 结论 , 在 a 20.01 KEF, 模型 中 g,, 
Bi, Bs 至 少 有 一 个 参数 不 等 于 零 . 然而 , 三 个 变量 中 的 两 个 了 检验 不 显著 (这 些 检验 的 p 值 在 输出 中 
着 重 显示 ) ,除了 焦油 (xi ) 是 三 个 变量 中 对 预测 一 氧化 碳 含 量 有 用 的 变量 , 这些 结果 是 潜在 多 重 共 
线性 的 第 一 个 迹象 . 

房 ,， 记 的 负 值 (在 输出 中 着 重 显示 ) 是 存在 多 重 共 线性 的 第 二 个 迹象 . 由 过 去 的 研究 , FTC 预期 
无 论 当 尼古丁 含量 (x2 ) 增 加 或 重量 (xs ) 增 加 时 ， 一 氧化 碳 含量 (y) 都 会 增加 .也 就 是 说 ,FTC 预期 y 
与 yx É y 5 x, 之 间 是 正 相关 , 而 不 是 负 相 关 . 

所 有 迹象 表明 存在 严重 的 多 重 共 线性 问题 O. 

为 了 确认 我 们 的 怀疑 , 用 SAS 计算 模型 中 3 对 自 变量 的 相关 系数 +, 所 得 的 输出 (着 重 ) 显示 在 
图 11.29 底部 . 可 以 看 出 焦油 (xi ) 与 尼古丁 (‰ ) 高 度 相关 (+ =0.9766) , MERC) 与 其 他 两 个 变量 笑 
度 相关 (7~0. 5). 3 个 相关 系数 的 p 值 都 小 于 0.05, 因此 , 在 w =0.05 KEF, 3 个 都 显著 不 为 0. 

一 且 发 现 多 重 共 线 性 问题 存在 , 有 多 种 方法 解决 这 个 问题 ,选择 哪 种 方法 取决 于 多 重 共 线 性 的 





O ”焦油 和 尼古丁 的 方差 扩大 因子 (VIF) 在 图 11.29 的 SAS 输出 中 给 出 , 都 超过 了 10. 
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严重 程度 和 回归 分 析 的 最 终 目 标 . 

面 对 高 度 相关 的 自 变量 时 , 一 些 研究 人 员 选 择 在 最 终 的 模型 中 只 包含 相关 变量 中 的 一 个 . 决定 
选取 哪 一 个 变量 的 方法 之 一 是 用 逐步 回归 , 将 在 12 章 中 讨论 . 一 般 来 说 , 根据 逐步 回归 法 , 多 重 共 线性 
的 自 变 量 集合 中 只 有 一 个 (或 少数 ) 保 留 在 回归 模型 中 ， 这 个 过 程 是 对 已 经 在 模型 中 的 所 有 变量 , 检验 
与 每 个 变量 关联 的 参数 . 例如 , 在 拟 合 前 面 介绍 的 汽油 里 程 等 级 模型 时 , 如 果 第 一 步 代 表 载 重量 的 变量 
作为 预测 汽油 里 程 等 级 的 显著 变量 引入 模型 ,代表 马力 的 变量 可 能 在 以 后 的 步 又 中 不 会 加 入 模型 当中 
因此 , 如 果 一 个 自 变 量 集合 认为 具有 多 重 共 线性 , 那么 用 逐步 回归 筛选 可 能 是 有 帮助 的 

如 果 对 利用 模型 进行 估计 和 预测 感 兴趣 , 也 许 不 会 从 模型 中 删除 任何 自 变量 . 当 存 在 多 重 共 线 
性 时 ,我 们 已 经 看 到 , 为 建立 因果 关系 而 解释 单个 6 是 危险 的 . 然而 , 只 要 用 于 预测 y 的 自 变量 值 在 
样本 数据 中 具有 多 重 共 线性 的 相同 模式 ,BE(y) 的 置信 区 间 和 y 的 预测 区 间 - 一 般 不 受 影响 . 这 就 是 说 ， 
必须 非常 小 心地 保证 x 变量 值 落 在 试验 范围 内 (将 在 问题 4 中 进一步 讨论 这 个 问题 ) 另外 , AUEB 
标 是 建立 y 与 自 变量 之 间 的 因果 关系 ,必须 设计 试验 来 消除 这 种 多 重 共 线性 . 


解决 由 多 重 共 线 性 产生 的 某 些 问题 3 
1， 从 最 终 模型 中 删除 一 个 或 多 个 相关 自 变 量 , 用 逐步 回归 (参看 12 章 ) 那样 的 筛选 法 帮助 决定 删除 哪些 变量 . 
.如果 决定 保留 模型 中 所 有 的 变量 : 
a. 避免 对 单个 感 参数 做 推断 ( 例如 在 y 与 预测 变量 之 间 建 立 因 果 关 系 ). 
b， 只 对 落 在 试验 区 域内 的 自 变量 值 推断 E(y) 及 未 来 的 y 信 ( 见 问题 4). 
3. 如果 最 终 目 标 是 建立 y 与 预测 变量 之 问 的 因果 关系 ,利用 试验 设计 (参看 13 31). 
为 了 减少 多 项 式 回归 模型 中 的 合 入 误差 ,对 自 变量 编码 ,使 得 对 某 个 变量 % 的 一 次 项 、 二 次 项 以 及 更 高 
次 项 不 是 高 度 相 关 的 (参看 12 x). 








N 


+ 














当 拟 合 一 个 多 项 式 模型 时 (例如 二 次 模型 E(y) = Bo +Bix By?) , HER x = x Hox, = 52 通常 是 
相关 的 ,如 果 相关 性 过 高 导致 计算 机 解 出 现 极 大 的 舍 人 误差 . 对 于 这 个 模型 , 解决 方案 不 是 删除 自 变量 
之 一 ， 而 是 以 这 样 一 种 方式 变换 变量 *, 使 得 与 2 的 编码 值 之 间 相关 性 有 本 质 上 的 减弱 . 对 多 项 式 
回归 模型 中 定量 自 变量 的 编码 将 在 12 章 讨 论 ， y 

问题 4: 在 试验 范围 之 外 预测 |o 

只 对 试验 范围 内 的 自 变量 值 , 也 就 是 在 试验 € 
中 用 到 的 自 变量 值 范围 内 拟 合 的 回归 模型 能 使 我 \ 
们 建立 E(y) 的 置信 区 间 和 y 的 预测 区 间 . 例如 ， = 
假定 进行 了 一 项 关于 200 ~400 下 之 间 几 种 不 同 温 
度 下 塑料 配件 的 平均 强度 试验 ，( 见 图 11.28) 对 
FE 200 <x= 400 下 内 的 x f£, 用 数据 拟 合 的 E L 
回归 模型 去 估计 E Cy) 或 预测 y 值 是 有 效 的 . 然 00 77 38 而 . 
而 , 如 果 试 图 外 推 到 试验 区 域 以 外 , 那么 拟 合 的 EREC F) 
模型 可 能 就 不 再 是 塑料 平均 强度 的 好 的 近似 ( 见 图 11. 30 在 试验 区 域 之 外 使 用 回归 模型 











”还 有 一 些 其 他 的 解决 办 法 , 例如 , 在 拟 合 高 阶 回 归 模型 时 ， 分 析 人 员 要 对 自 变量 编码 , 使 得 对 某 个 变量 * 的 高 阶 项 ( 如 
所 ) 与 不 是 高 度 相关 . 一 种 变换 是 Z = (x -x)/s( 参 看 选 学 节 12.5) ,其 他 关于 多 重 共 线 性 的 更 复杂 的 方法 (如 岭 回 
归 ) 超 出 了 本 书 的 范围 ,查阅 参考 文献 . 
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图 11. 30). 例如 , 当 温 度 达 到 500 开 时 , 塑料 会 变 得 很 脆弱 并 且 没 有 任何 弹性 . 但 有 时 必须 估计 和 预 
测试 验 区 域 以 外 的 数据 . 如 果 要 外 推 , 必须 记 住 较 大 的 外 推 误差 的 可 能 性 . 


应 用 练习 

11.48 ”全球 变 暖 与 国外 投资 , Journal of World-Systems 
Research (2003 年 夏 ) 发 表 了 一 篇 关于 国外 投资 与 二 
氧化 碳 排放 量 之 间 关 系 的 研究 ,研究 者 对 66 个 发 展 


中 国家 建立 了 1996 年 排放 二 氧化 碳水 平 y 作为 7 个 
自 变 量 的 函数 模型 . 每 对 自 变量 的 相关 系数 矩阵 + 
列 于 下 面 . 指出 高 度 相关 的 自 变 量 , 这 些 高 度 相关 
的 自 变量 包含 在 回归 模型 中 会 产生 什么 问题 ? 


练习 11. 48 的 相关 系数 矩阵 





X, =]n 
B 变量 mo @ “& “@ “ (1980800 CO, KÆ) 

x, = ]n( 1980 年 的 外 国 投资 ) 013 0.57 030 -0.38 0.14 -0.14 
x, = 1980 年 的 国内 总 投资 049 0.36 -0.47 -0.14 0. 25 
xs = 1980 年 的 贸易 出 口 0.43 -0.47 -0.06 -0.07 
x4 =ln(1980 年 的 GNP) -0.84 -0.53 0. 42 
xs =1980 年 的 农产品 0. 45 -0.50 
xg =1， 如 果 是 非洲 国家 ; xç =0, 如果 不 是 -0.47 


一 一- 一 ~ -一 
资料 来 源 ; Grimes, P. , and Kentor, J. “ Exporting the greenhouse; Foreign capital penetration and CO, emissions 1980 — 1996. ” Jour- 
nal of World-Systems Research, Vol. IX, No. 2, Summer 2003( [ff 3& B). 


11.49 ”信息 系统 样机 . 为 了 满足 新 软件 产品 日 益 增 
长 的 需要 , 许多 系统 开发 专家 采用 了 样机 方法 . 
Journal of Computer Information Systems (1993 年 春 ) 
调查 了 样机 对 系统 开发 生命 周期 (SDLC ) 的 影响 . 
随机 选择 500 个 企业 水 平 的 管理 信息 系统 (MIS ) E 
理 人 员 进 行 调查 . 三 个 可 能 的 自 变量 是 : (1) 样机 
对 SDLC 每 阶段 的 重要 性 ; (2) 样 机 对 SDLC 提供 
的 支持 度 ;(3) 样 机 代替 SDLC 每 阶段 的 水 平 . 附 表 
给 出 SDLC 某 个 阶段 调查 数据 中 三 个 自 变量 两 两 之 
间 的 相关 系数 ,你 会 建议 在 回归 分 析 中 使 用 所 有 三 
个 自 变量 吗 ? 请 解释 . 





AR H 对 相关 系数 
重要 性 -REKE 0. 2682 
重要 性 - 支持 度 0. 6991 
代替 水 平 -支持 度 -0. 0531 


资料 来 源 : Hardgrave, B. C. , Doke, E. R. , and Swanson, 
N. E. , "Prototyping effects of the system development life cy- 
cle; An empirical study. " Journal of Computer Information 
Systems, Vol. 33, No. 3, Spring 1993, 16 页 ( 表 1). 

11.50 泥 煤 的 蒸汽 处 理 . 生物 工程 师 想 建立 在 泥 煤 
的 燕 汽 处 理 期 间 碳水 化 合 物 的 深 解 量 (y) 作为 温度 
(x )、 暴 露 时 间 ( 刀 ) 和 pH {Ë C ) 的 函数 模型 , 用 
收集 到 的 15 个 泥 煤 的 样本 数据 拟 合 模型 ; 

E(y) =Bo * Bii +B,x; + Box, 
回归 结果 总 结 如 下 : 


y= -3000 +3. 2x, -0. 4x,-1l.1x, K? =0.93 
sa =2.4 5 20.6 sa, =0.8 
T2 =0.92 rs =0.87 r4-0.81 
基于 这 些 结果 , 生物 工程 师 得 到 如 下 结论 : 三 个 自 
变量 xi, os, %3 均 不 是 碳水 化 合 物 溶解 量 y 的 有 用 
预测 变量 . 你 同意 他 的 观点 吗 ? 请 解释 . 

11.51 工程 市 场 研究 . 一 家 工程 咨询 公司 的 主管 正 
在 研究 与 其 继续 利用 市 场 研究 公司 的 服务 , 不 如 
建立 自己 的 市 场 研究 部 门 的 可 能 性 . 主管 想 知道 ， 
根据 工龄 应 该 支付 市 场 研究 人 员 多 少 薪金 . 一 位 独 
立 的 咨询 员 提 出 了 二 次 模型 : 

E(y) =B * Bix +B, 
其 中 , y-ERCT XO), = 工龄 . 为 了 拟 合 这 个 
模型 , 咨询 员 随机 抽取 了 其 他 公司 的 3 个 市 场 研 究 
员 作 为 样本 , 并 记录 了 附 表 给 出 的 信息 . 对 咨询 员 





提出 的 模型 恰当 性 给 出 你 的 观点 . 
y x 
研究 员 1 40 2 
研究 员 2 25 1 
研究 员 3 42 3 





11.52 相关 变量 的 多 余部 分 . 哈密 顿 用 下 表 中 的 数 
据 作为 一 个 例子 阐述 多 重 共 线 性 问题 . 表 中 的 x, ， 
纪 ,y 值 分 别 表示 随机 选取 的 居民 房地产 的 评估 地 
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价 、 评 估 的 升值 和 销售 价格 (所 有 测量 值 单位 是 ; 
千 美 元 ). 





Xi Xa y | Xi X, y 
223 966 123.7 || 304 7711 128.6 
25.7 89.4 1266 | 326  SL1 1084 
38.7 44.0 1200 || 33.9 505 1120 
31.0 664  119.3]| 23.5 851 1156 
33.9 49.1 110.6 | 27.6 659 1083 
28.3 85.2 130.3 | 39.0 490 1263 
302 804 13.3 | 3L6 696 1246 
21.4 90.5 114.4 








资料 来 源 : Hamilton, D. “Sometimes R2 >r tn: Corre- 
lated variables are not always redundant. " The American Statis- 
tician, Vol. 41, No. 2, May 1987, p. 129 — 132. 


a. 计算 y 和 之 间 的 相关 系数 ,有 证 据 表明 销售 价 
格 与 评估 的 土地 价格 之 间 有 线性 关系 吗 ? 

b. 计算 y 和 之 间 的 相关 系数 ,有 证 据 表明 销售 
价格 与 评估 的 升值 之 间 有 线性 关系 吗 ? 

c. 根据 a、b 的 结果 , 认为 模型 E(y) =B +Bix + 
Bax: 对 预测 销售 价格 有 用 吗 ? 

d. 用 一 个 统计 计算 程序 包 拟 合 c 中 模型 ， 并 对 模 


11.12 多重 回归 分 析 的 步 又 总 结 


我 们 已 经 讨论 了 多 重 回归 分 析 的 一 些 方法 , 建立 因 变量 y 作为 多 个 自 变量 xl， xz, e 


型 的 恰当 性 进行 检验 . 特别 注意 天 的 值 ， 这 个 
结果 与 你 对 e 的 回答 结果 一 - 致 吗 ? 

e. 计算 fll x, 之 间 的 相关 系数 , 结果 表明 了 什么 ? 

f. 许多 研究 人 员 通 过 从 模型 中 删除 所 有 多 余 的 变 
量 来 避免 多 重 共 线 性 . 推荐 本 例 使 用 这 种 策略 
吗 ? 请 解释 . (哈密 顿 注释 : 这 种 情况 就 好 比 
“把 孩子 和 洗澡 水 一 起 倒 掉 ”一 样 . ) 

11. 53 烟草 数据 分 析 . 参考 例 11. 16 的 FTC 烟草 数 

据 ,回忆 保存 在 文件 FTC2 中 的 数据 . 

a， 对 数据 拟 合 模型 Ely) =ñ, € Bos ,存在 焦油 含量 
(xi) 对 预测 一 氧化 碳 含量 (y) 是 有 用 的 证 据 吗 ? 

b. 对 数据 拟 合 模型 E(y) 2, «Bx, ,存在 尼古丁 含量 
(x2) 对 预测 一 氧化 碳 含量 (y) 是 有 用 的 证 据 吗 ? 

e. 对 数据 拟 合 模型 E(y) = ñ, + B,x; ,存在 重量 
(x, ) 对 预测 一 氧化 碳 含量 (y) 是 有 用 的 证 据 吗 ? 

d. 分 别 比较 a、b、c 模型 中 Bi , B, B, 与 例 11. 16 
中 拟 合 的 多 重 回 归 模 型 符号 . 当 从 模型 中 删除 
一 个 自 变 量 时 , B 符号 的 显著 变化 是 严重 多 重 
共 线 性 问题 的 另 一 种 表现 . 


x XE 函数 的 


建 模 技巧 ,在 构造 和 使 用 多 重 回归 模型 时 遵循 的 步骤 与 简单 线性 模型 有 许多 相同 ， 


1. 假设 概率 模型 的 形式 . 
2. 用 最 小 二 乘法 估计 模型 的 系数 . 
3. 指定 e 的 概率 分 布 ,估计 o2. 


4. 用 方差 分 析 下 检验 和 多 重 决定 系数 R2 检查 模型 的 恰当 性 ,对 单个 B 参数 的 了 检验 有 助 于 决 


定 模 型 的 最 终 形式 . 


5. 进行 残 差分 析 确 定数 据 是 否 与 第 3 步 的 假定 一 致 
6. 如 果 模 型 恰当 , 并 且 假 定 满足 ， 就 可 以 用 来 估计 和 预测 未 来 观测 的 y 值 . 
假定 模型 已 经 指定 , 我 们 在 本 章 已 经 包含 了 步骤 2 ~6. 第 12 章 将 专门 讨论 步骤 1 一 一 模型 构造 . 


快速 回顾 
重要 公式 


B=(XX) XY 


SSE-YY-f'x'Y 
SSE 
n -(k41) 


Var( 房 ) -cjo?, Fep cy EREC X) 7 088 j 个 对 角 元 素 


s? =MSE = 





最 小 二 乘 解 的 矩阵 表示 

误差 平方 和 的 矩阵 表示 

对 含有 上 个 自 变量 模型 的 o? 的 估计 
B 估计 的 方差 
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r-Ê 检验 H, : B, =0 的 检验 统计 量 
SÊ; 
Bi = (1,5)sg, FEP c SAAR A BREE n- (k +1) B; 的 100(1 - a) % BAAK lB] 
p -Sr — SSE 多 重 决定 系数 
ss, 
n-l ` 
R=1-| zum] -R) 调整 的 多 重 决定 系数 
_MS( 模 型 ) RUk $36 H, : B, -B, =… =B, =0 的 检验 统 i 
F= MSE  (1-R)/[n-(k+1)] IH: B. =p B, =0 的 检验 统计 量 
$ ty) Za'(X'X) la 当 a =[1, si, x, ]BF, EG) 89 100(1 -a)% 和 置信 区 间 ` 
$ £t,5(s) y l1 a'(X'X) -la 当 w =11， XI x, ]Bj, 7 的 100(1 -a)% 置 信 区 间 
E(y) =Bo +B1x1 +e 含有 两 个 定量 自 变量 的 一 阶 模型 
E(y) =Bo +Bix, * Bx, * Bax x, 含有 两 个 定量 自 变量 的 交互 作用 模型 
E(y) 2 *Byx +B, 2 二 次 模型 


| y-f=ê 回归 残 差 
n 一 





符号 汇集 
LUN S 旋 沿 aa C — 
x x-1 平方 在 y 与 x 的 关系 中 允许 弯曲 的 二 次 项 
EZEZ x-1x-2 交互 作用 项 
MSE M-S-E 误差 的 均 方 (估计 0?) 
Bi 贝塔 -i 模型 中 x 的 系数 
B. 贝塔 -i-hat B, 的 最 小 二 乘 估计 
5$; s 贝塔 -i-hat B; 估计 的 标准 误 
m RR- 平 方 多 重 决定 系数 
E 调整 的 R- 平 方 调整 的 多 重 决定 系数 
F 检验 模型 整体 恰当 性 的 检验 统计 量 
ë epsilon-hat 估计 的 随机 误差 或 残 差 


In(y) 7 的 自然 对 数 因 变 量 的 自然 对 数 
CTS 


本 章 简要 提示 


多 重 回 归 的 步骤 : (1) 假设 模型 的 确定 性 分 量 形式 ， 《2) 用 最 小 二 乘法 估计 未 知 参数 B; 
(3) 对 随机 误差 (s) 作 假定; (4) 检查 假定 ， 对 模型 作 修正 ; (5) 统计 评价 模型 的 恰当 性 ， 
(6) 如 果 认 为 有 用 , 利用 模型 进行 估计 和 预测 . 

2 的 4 个 假定 : (1)e 的 均值 是 0; (2) 对 所 有 的 x 值 ,se 的 方差 是 不 变 的 ; (3)e 的 分 布 是 正 态 
分 布 ; (4)e 的 值 相互 独立 . 

个 定量 变量 x 的 一 阶 模型 : E(y) =Bo tix, *tB,x,, 其 中 每 个 B， 表示 当 其 他 变量 固定 
时 , x; 每 增加 一 个 单位 y 的 改变 量 . 

调整 的 决定 系数 (Rs ) 不 能 通过 在 模型 中 添加 自 变 量 而 “逼近 ”1 . 

推荐 检查 模型 的 统计 效用 : (1) 进 行 全 局 下 检验 ; (2) 如 果 检 验 是 显著 的 ， 仪 对 “最 重要 ”的 B 
参数 进行 了 检验 ; (3) 解 释 2s 的 值 ; (4) 解释 RZ 的 值 . 


456 


A 


第 11 章 





° 2 个 定量 变量 x 的 交互 作用 模型 E(y) =pBo *Bix, * Box; + Baxi xs, HEB, t Bax; ) 表 示 固 定 Xj 
f, as 每 增加 一 个 单位 y 的 改变 量 ，(B, + psxi ) 表 示 辕 定时 ,x 每 增加 一 个 单位 y 的 改变 量 . 


一 旦 检验 认为 交互 作用 是 重要 的 , 则 不 对 模型 中 的 一 阶 项 进行 了 检验 . 


° 1 个 定量 变量 x 的 二 次 模型 : E(y) =po +Biz *Box^, ob B, >0 意味 着 向 上 弯曲 , B, <0 意味 着 向 


下 弯曲 . 


一 旦 检验 认为 模型 是 曲线 的 , 则 不 对 模型 中 的 一 阶 项 进行 了 检验 . 


° 回归 残 差 的 性 质 ; (1) 残 差 和 等 于 0;.(2) 残 差 平方 和 = SSE. 
° 检测 错误 指定 模型 : 对 模型 中 每 个 定量 变量 画 残 差 图 , 寻找 趋势 ( 例如 非 线性 趋势 ). 


° 识别 异常 值 : 找 出 绝对 值 大 于 3s 的 残 差 


* 检测 非 正 态 误差 : 画 残 差 的 直方 图 、 茎 时 图 或 正 态 概率 图 , 寻找 与 正 态 性 的 严重 偏离 . 

* 检测 非常 数 的 误差 方差 ( 即 异 方差 性 ) : 画 关 于 y 的 残 差 图 ,寻找 模式 (例如 锥 形 模式 ). 

° 多 重 共 线 性 出 现在 模型 中 的 两 个 或 多 个 自 变量 x 相关 时 . 

”多重 共 线性 的 指示 器 : (1) 高 度 相关 的 x; (2) 全 局 检验 显著 , 但 所 有 的 了 检验 不 显著 ; (3)8 估计 


值 的 符号 与 预期 的 相反 . 


° 外 推 发 生 在 对 落 在 样本 数据 范围 之 外 的 x 值 预测 y 时. 


补充 应 用 练习 

11.54 混凝土 的 渗透 性 . J. Vuorinen 进行 了 一 系列 实 
验 来 收集 关于 混凝土 渗透 性 系数 的 信息 ( Magazine of 
Concrete Research. 1985 年 9 月 ). 在 一 个 实验 中 , 对 混 
泥土 不 同 渗透 性 和 孔隙 率 的 组 合 , 将 混凝土 样品 置 于 
饱和 水 压 下 一 段 时 间 后 , 记录 从 混凝土 样品 微 孔 中 渗 
出 的 水 量 . 对 一 种 渗透 性 和 孔隙 率 的 组 合 , 经 不 同时 
间 间 隔 得 到 的 水 量 列 在 下 表 中 . 





时 间 i(s) 渗 出 的 水 量 WW( 克 /每 简 ) 
201 3.88 
325 4. 93 
525 6.42 
TIS 7. 80 
975 8.72 
1200 9.60 





资料 来 源 , Vuorinen, J. “Applications of diffusion theory to per- 
meability tests on concrete, Part H. Pressure-saturation test on 
concrete and coefficient of permeability. " Magazine of Concrete 
Research. Vol. 37, No. 132, Sept. 1985. p. 156(3& II. I. 


a. 根据 Vuorinen 的 理论 ， 对 于 大 多 数 的 渗透 性 和 孔 
MRH KH, 活 出 的 水 量 与 时 间 的 平方 根 大 至 
呈 线 性 关系 ,对 表 中 的 数据 拟 合 下 列 模型 ; 

E(w) =o +a, Jf 
b. 有 充分 的 证 据 表 明 渗 出 的 水 量 与 时 间 的 平方 根 呈 





线性 关系 吗 ? 用 a =0. 1 检验 . 


11.55 混凝土 的 渗透 性 ( 续 ). 参考 练习 11.54, Vuorin- 


en 用 9 个 孔 陵 率 和 渗透 性 组 合 拟 合 了 渗水 量 与 时 间 
的 关系 模型 ,并 用 这 个 结果 提出 了 混凝土 渗透 系数 y 
的 模型 . 特别 地 , 拟 合 模型 2 : 

E(y) =B *Byx, +B,x, 
其 中 , x, = 水 泥 的 孔隙 率 ,x, = 相应 于 渗水 量 与 时 间 回 
归 直 线 估 计 的 斜率 系数 (& ). 数据 列 在 下 表 中 . 





RR 
渗透 性 系数 y 估计 的 渗水 量 -时 间 的 
-11 TURO xı "E 
(m/s) x10 斜率 系数 x 
1.00 0.050 0.903 
1.00 0.035 0.722 
1.00 0.025 0.590 
0.10 0.050 0.345 
0.10 0.035 0.282 
0.10 0.025 0.233 
0.01 0.050 0.103 
0.01 0.035 0.091 
0.01 0.025 0.078 
— 25 mm 0% 3 


资料 来 源 : Vuorinen, J. “ Applications of diffusion theory to per- 
meability tests on concrete, Part II; Pressure-saturation test on 
concrete and coefficient of permeability. " Magazine of Concrete 
Research. Vol. 37, No. 132, Sept. 1985. p. 156( 3€ IL D). 


a. 求 最 小 二 乘 预 测 方程 并 解释 6 估计 值 . 


b. 检验 整体 模型 的 恰当 性 , 并 解释 检验 的 p 值 . 
c. 有 证 据 表明 混凝土 孔 阶 率 +, 是 渗透 性 系数 y 的 有 


O FXE, Vuorinen 拟 合 的 是 对 数 模型 log(y) =£ 8, log(x,) *Bilog(x;) +z. 
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f 


用 预测 量 吗 ? 用 a =0. 05 检验 . 
d. 有 证 据 表明 估计 的 渗水 量 与 时 间 关 系 的 斜率 是 渗 
透 性 系数 y 的 有 用 预测 量 吗 ? 用 a =0.05 检验 . 
e. RK 尺 的 值 并 解释 . 
f. >K o 的 估计 值 , 并 解释 . 
g. 3a, 20.05, x, =0.30 时 , 求 y 的 %% 预测 区 间 并 
解释 结果 . 
11.56 ERRIRE. Journal of Applied Ecology( Vol. 
32, 1995) 发 表 了 一 篇 关于 幼 雪 切 喂养 习惯 的 文章 . 在 
42 个 喂养 试验 中 , 幼 委 的 体重 变化 、 消化 效率 、 酸性 
洗涤 纤维 ( 均 以 百分比 度量 ) 和 食物 (植物 或 鸭 食 ) 数 
据 保存 在 文件 SNOWGEESE 中 . 选择 的 观察 值 列 在 下 
表 中 ,植物 学 家 感 兴趣 的 是 预测 体重 变化 y 作为 其 他 
变量 的 函数 关系 . 考虑 一 阶 模型 E(y) =B 8 Bux, + 
B,x, , Jp x, 为 消化 效率 , x 为 酸性 洗 洪 纤维 . 
a. 求 体重 变化 y 的 最 小 二 乘 预测 方程 , 
b. 解释 a 中 方程 的 B 估计 值 . 
c. 通过 检验 确定 消化 效率 x, 是 否 为 体重 变化 的 有 用 
线性 预测 量 , 用 a =0.01 检验 . 
. 3K B, 的 99% 置 信 区 间 , 并 解释 结果 . 
e. 计算 并 解释 尼 RI ,哪个 统计 量 推荐 为 模型 拟 合 
的 度量 ? 请 解释 . - 
f. 整体 模型 对 预测 体重 变化 是 否 统计 有 用 ? 用 a = 
0.05 检验 . 
(前 5 个 和 最 后 5 个 实验 值 . ) 
体重 改变 消化 效率 酸性 洗涤 纤维 


a 





RiR ur (96) (96) (96) 
1 植物 -6 0 28.5 
2 植物 -5 2.5 27.5 
3 植物 -4.5 5 27.5 
4 植物 0 0 32.5 
5 植物 2 0 32 
38 meer 9 59 8.5 
39 BA 12 52.5 8 

40 IA 8.5 75 6 
41 BA 10.5 72.5 6.5 
4 gir 14 69 7 





资料 来 源 : Gadallah, F. L. , and Jefferies, R. L. , “Forage quali- 
ty in brood rearing areas of the lesser snow goose and the growth 
of captive goslings. "Journal of Applied Biology, Vol.32, No.2, 
1995. p.281 -282( 经 图 2 和 图 3 改变 ). 


11.57 带 激光 的 太阳 能 照明 . 马萨诸塞 大 学 的 工程 师 


研究 了 航天 应 用 中 对 太阳 能 照明 利用 半导体 激光 器 的 
可 行 性 (Journal Applied Physics, 1993 年 9 H). 用 量子 


阶 激 光 器 进行 了 n=8 次 试验 , 日 光 泵 的 临界 电流 (7) 
和 波导 AI 的 摩尔 分 数 (x) 的 观察 结果 如 下 : 





临界 电流 y( A/cm 2) 波导 AI 摩尔 分 数 x 
273 0.15 
175 0.20 
146 0.25 
166 0.30 
162 0.35 
165 0. 40 
245 0.50 
314 0.60 





资料 来 源 : Unnikrishnan, S. , and Anderson, N. G. “ Quantum- 

well lasers for direct solar photopumping. " Journal of Applied 

Physics. Vol.74, No. 6, Sept. 15, 1993. p. 4226 数据 摘自 图 2). 

a. 研究 者 的 理论 认为 : 临界 电流 (y) 与 波导 AT 成 分 
《x%) 之 间 的 关系 呈 U 形 曲 线 , 假 设 一 个 相应 于 这 个 
理论 的 模型 . 

b， 画 出 数据 的 散 点 图 , 并 评价 研究 者 的 理论 . 

c. 用 最 小 二 乘法 对 数据 拟 合 二 次 模型 E(y) = B, + 
Bix Bx. 

d. Ha =0.1 对 研究 者 的 理论 进行 检验 . 


11.58 塑料 成 形 试验 . 为 了 研究 挤 压 成 形 时 压力 与 


温度 了 对 一 种 新 型 塑料 的 强度 y 产生 的 影响 , 进行 一 
项 实验 . 对 5 种 压力 与 温度 组 合 都 准备 了 两 种 塑料 样 
ih, 并 以 随机 顺序 试验 , 记录 每 个 样品 的 断裂 强度 . 
为 了 计算 方便 , 对 自 变量 采取 编码 如 下 : 








x . P -200 x T -400 
! 10 27 25 
n=10 个 数据 列 在 表 中 . 
y Xl x 
5.2; 5.0 -2 2 
03;-01 -1 -1 
-L2;-L1 0 -2 
22; 20 1 -1 
62; 61 2 2 





a. 给 出 拟 合 模型 y = B. +x +Bxz +e 所 需要 的 矩 
[E X, Y. 

b. 求 最 小 二 乘 预测 方程 , 解释 6 估计 值 . 

c. TE SSE, s JI s, 解释 s 的 值 . 

d. 这 个 模型 对 预测 y 提供 信息 了 吗 ? 用 o = 0.05 
检验 . 

e. 计算 RC 并 解释 . 

f. Ha =0. 05 检验 原 假设 B, =0, 这 个 检验 的 实际 意义 
是 什么 ? 

g xi = -2, x, =2 时 ,计算 塑料 平均 强度 的 90% 的 
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置信 区 间 . b. JH R? 的 值 检验 整体 模型 恰当 性 . 取 a =0.05. 


h. 假设 一 个 塑料 样品 安装 在 道格拉斯 DC-10 飞机 引 
EE. 当 x = -2, x, =2 BF, 计算 这 个 样品 强度 的 
90% 的 预测 区 间 . 


11.59 页 岩 碎 片 的 研究 . Canadian Geotechnical Journal 


(1985 年 8 月 ) 报 道 了 一 项 关于 昆 土 顿 页 岩 , 一 种 结实 
的 页 岩 , 作为 岩石 填充 建筑 材料 使 用 的 可 靠 性 研究 . 
特别 地 , 研究 员 希 望 估计 碎片 材料 的 压力 与 张力 关 
系 . 根据 这 篇 论文 所 示 的 图 , 附 表 中 的 数据 是 潮湿 页 
岩 样 品 的 偏 应 力 和 轴 向 应 变 , 


偏 应 力 y 轴 向 应 变 x 偏 应 力 y — 轴 向 应 变 x 








(kPa) (%) (kPa) (%) 

500 10 | GO 13.5 
2000 2.8 6625 16.7 
2750 4.3 7000 19.8 
3500 6.0 7125 23.0 
4375 75 7000 26.0 
4875 9.0 7125 27.5 
5250 10.5 





资料 来 源 ; Caswell, R. H. , and Trak, B. “Some geotechnical 
characteristics of fragmented Queenston Shale.” Canadian 
Geotechnical Journal, Vol.22, No.3, Aug. 1985. p.403 —408. 


a. 加 出 数据 的 散 点 图 ,存在 什么 类 型 的 关系 ? 

b. 对 数据 拟 合 二 次 模型 E(y) 2B, +Bix +B, ,给 出 
最 小 二 乘 预 测 方程 . 

- 检验 假设 : 偏 应 力 y 随 轴 向 应 变 x 以 逐渐 递减 的 速 

度 增 长 ,用 a =0. 05 检验 . 

SR o 的 估计 值 并 解释 . 

e. 计算 决定 系数 R° 并 解释 . 

. 求 x=20 时 E(y) 的 90% 置信 区 间 , 并 解释 这 个 
结果 . 

11.60 职业 安全 研究 . 职业 安全 的 一 个 重要 目标 是 

“主动 关心 ”. 当 认识 到 环境 的 危险 和 不 安全 工作 习 

T, 并 要 对 这 些 不 安全 条 件 或 行为 采取 适当 的 正确 

行动 时 , 雇员 们 对 他 们 同事 的 安全 表示 主动 关心 

(AC). 能 提高 雇员 主动 关心 安全 程度 的 三 个 假设 的 

因素 是 :(1) 高 度 的 自尊 ;(2) 乐 观 ;(3) 团队 的 凝聚 

力 . Applied and Preventive Psychology (1995 4 4) pü 

图 用 拟 合 模型 E(y) 7o *Bix, +B% * Bux, 使 AC 

假设 得 到 经 验 支持 , 其 中 , y = AC 得 分 (用 15 分 制 

度量 主动 关心 )，x = 自尊 得 分 , x, = 乐观 程度 得 

分 , z, = 团队 凝聚 力 得 分 . 根据 一 个 大 型 纤维 制造 工 

T, 收集 n=31 个 计时 工人 数据 的 回归 分 析 , 得 到 

多 重 决定 系数 RN =0. 362. 

a. 解释 R° 的 值 . 


e 


= 


py 


11.61 RÆK. Journal of Applied phycology ( 1994 


年 12 月) 刊登 了 关于 水 藻 在 室内 环境 下 季节 性 生长 活 
动 的 研究 ,用 二 次 模型 FE(y) =B, +B,x +B, 对 日 生 
长 速度 y 关于 温度 x 进行 回归 . 某 种 藻类 生长 在 温度 
范围 从 10 ~32% 的 室内 玻璃 容器 中 , 用 =33 个 这 样 
的 实验 数据 来 拟 合 二 次 模型 ,得 到 下 面 的 结果 ， 

f= -2.5140.55x -0. 01x? , R? =0. 67 
a. 画 出 最 小 二 乘 预 测 方程 图 , 并 解释 这 个 图 . 
b. 解释 尼 值 的 含义 . 
c. 模型 对 预测 水 藻 生 长 速度 y 有 用 吗 ? 用 wa = 

0. 05 来 检验 . 


11.62 机 器 停工 期 研究 . 一 位 操作 管理 者 试图 为 一 


台 机 器 每 个 月 停工 检修 的 期 望 时 间 长 度 (h)E(y) 

作为 机 器 的 类 型 (001 或 002) 和 机 器 年 龄 (年 ) 的 函 

数 建立 一 个 模型 ,管理 者 提出 下 面 的 模型 , 

E(y) =B * Bix, * Bx? +B% 

其 中 , x, = 机 器 年 龄 ;x, =1, 若 机 器 为 001 型 ; x, = 

0, 若 机 器 为 002 型 . 

a. 用 这 里 给 出 的 n=20 台 机 器 的 停工 数据 估计 模 
型 参数 

b. 这 些 数据 能 提供 足够 的 证 据 , 说明 这 位 管理 者 
提出 的 模型 中 二 次 项 (对 ) 是 必要 的 吗 ? H] o= 
0. 05 检验 . 

c. Ha -0. 10 检验 原 假设 B - B, =0, 联 系 问题 解 
释 检 验 的 结果 . 





停工 时 间 ”机 器 年 龄 如 ”机 器 类 型 

(每 月 小 时 数 ) CE) (型 ) ? 

10 1.0 001 1 

20 2.0 001 1 

30 2.7 001 1 

40 4.1 001 1 

9 1.2 001 1 

25 2.5 001 1 

19 1.9 001 1 

41 5.0 001 1 

22 2.1 001 1 

12 1.1 001 1 

10 2.0 002 0 

20 4.0 002 0 

30 5.0 002 0 

44 8.0 002 0 

9 2.4 002 0 

25 5.1 002 0 

20 3.5 002 0 

42 7.0 002 0 

20 4.0 002 0 

13 2.1 002 0 
一 一 21 «2 — 0 | 
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11.63 降雨 过 程 中 的 土壤 流失 . 在 降雨 过 程 中 , 用 

作 土 壤 肥 料 的 磷 会 污染 淡水 资源 ,因此 , 水 质 工程 

师 估 计 水 中 溶解 磷 的 总 量 是 重要 的. Geoderma 

(1995 年 6 月) 刊登 了 在 奥 克 拉 荷 马 收集 的 20 个 肥 

料 分 段 的 水 样 中 , 土壤 流失 与 溶解 磷 百 分 比 之 间 

的 关系 研究 , 数据 在 下 表 中 给 出 . 

a. 画 出 数据 的 散 点 图 ,发 现 线性 或 曲线 趋势 了 吗 ? 

b. 对 给 定 的 数据 拟 合 二 次 模型 E(y) = B, + 
pix tB. 

c. 通过 检验 确定 溶解 磷 百 分 比 (y) 与 土壤 流失 量 
(x) 之 间 是 否 存在 曲线 关系 ,用 a =0. 05 检验 . 





水 样 ”土壤 流失 x( 千 米 “ 半 英亩 ) ”溶解 磷 百 分 比 7 
1 18 42.3 
2 17 50.2 
3 35 52.7 
4 16 77.1 
5 14 36.8 
6 54 17.5 
7 153 66.4 
8 81 67.5 
9 183 28.9 
10 284 15.1 
11 767 20.1 
12 148 38.3 
13 649 5.6 
14 479 8.6 
15 1371 5.5 
16 9150 4.6 
17 15 022 2.2 
18 69 77.9 
19 4392 7.8 


20 312 42.9 
资料 来 源 : Sharpley, A.N. ， Robinson, J. S. , and Smith S. 
J. *Bioavailable phosphorus dynamics in agricultural soils and 
effects on water quality. " Geoderma. Vol.67, No.1 -2 , June 
1995, p. 11( X€ 4). 


11.64 地 下 水 中 的 砷 . 参考 练习 11. 20 Environmental 
Science and Technology(2005 年 1 H ) 关 于 检验 地 下 
水 中 砷 的 商用 设备 可 靠 性 研究 . 回忆 对 保存 在 文 
fF ASWELLS 中 的 数据 拟 合 了 砷 水 平 y 作为 纬度 、 
经 度 及 深度 的 函数 的 一 阶 模型 .对 模型 进行 完整 
的 残 差分 析 ,你 建议 对 模型 进行 一 些 修正 吗 ? 
11.65 海水 溶化 池 的 特征 . 参考 练习 11. 37 中 冰 表 
面 反照 率 的 研究 ,对 保存 在 文件 PONDICE 中 的 数 
据 拟 合 了 宽带 表面 反照 率 水 平 (y) 作为 池 深度 (z) 
的 函数 的 二 阶 模型 对 模型 进行 完整 的 残 差 分 析 ， 
你 建议 对 模型 进行 一 些 修正 吗 ? 


11.66 声 树 克隆 的 生态 学 研究 . 在 一 项 对 杨 树 内 的 


水 关系 研究 中 , 从 种 植 在 威斯康星 州 莱 因 兰 德 附近 
的 雨 果 沙 澳 苗 大 的 搬 枝 中 选择 4 个 捅 枝 , 其 中 2 个 
播 枝 来 自 两 棵 杨 树 克隆 (标记 为 3263 和 5271) , 2 个 
播 枝 来 自 另 外 两 棵 杨 树 克隆 (标记 为 3331 和 5319) 
《选择 这 4 棵 克隆 是 因为 它们 的 生长 速度 不 同 ). H 
为 克隆 杨 树 的 根 渗 透 能 力 不 同 , 所 以 它们 从 土壤 中 
吸收 水 分 的 能 力也 不 同 , 研究 人 员 考 察 了 克隆 杨 树 
的 土壤 水 势 与 它们 的 蒸腾 速度 之 间 的 关系 . 在 将 近 
2 周 的 时 间 内 ,对 选取 的 捅 枝叶 子 每 天 分 别 测量 土 
BUKSS y (MPa) 和 蒸腾 流量 密度 x(mg/cm? - s). 然 
后 分 别 对 4 个 克隆 插 枝 的 数据 进行 分 析 , 研 究 员 们 
用 多 重 回归 对 4 个 数据 集 拟 合 二 次 模型 
y=Bo tBix +B, +e 

结果 总 结 在 下 表 中 . 

克隆 ” 最 小 二 乘 预 测 方法 A b R n 

5263 f= -1.47 -2. 53x +0. 12x? 0.14 0.01 0.62 418 

5319 $= -1.48 -1.90x 40.087. 0.14 0.01 0.59 417 

5331 f= -111-2.43x +0. 14x? 0.19 0.02 0.53 315 

5271 f= -1.67 -1. 89x «0.07532 0.10 0.01 0.68 315 
资料 来 源 : Pallardy, S. G. , and Kozlowski, T. T. "Water rela- 
tion of Populus clones. " Ecology. Feb. 1981, Vol. 62, p.150 — 
169. Copyright 1981, the Ecological Society of America. 


对 4 个 克隆 中 的 每 一 个 : 

a. 解释 R E. 

b. 检验 假设 : 整体 模型 对 预测 杨 树 克 隆 叶子 的 土 
壤 水 势 是 有 用 的 ,用 a =0. 05 检验 . 

c. 有 证 据 表明 联系 土壤 水 势 y 与 蒸腾 流量 密度 x 
之 间 的 响应 模型 存在 曲线 关系 吗 ? 用 a = 0. 05 
检验 . 

d. Jii b, c 中 进行 的 检验 有 效 性 所 需要 的 任何 假定 . 





11. 67 烧结 试验 . 烧结 是 一 种 最 重要 的 材料 科学 技 


R, 用 来 将 粉 状 材料 转化 为 多 孔 的 固体 物体 . 下 面 
两 种 度量 刻画 了 最 终 产 品 的 特征 : 
V, = 最 终 产 品 中 国体 部 分 所 占 体 积 百分比 





-( 固体 体积 ) - 100 
气孔 体积 + 固体 体积 


Sy = 产品 的 每 单位 体积 中 固体 表面 积 -气孔 表面 积 
当 V, =100% 时 , 产品 完全 是 固体 , 即 它 不 含有 孔 . V, 
和 S, 都 是 通过 显微镜 观察 烧结 材料 的 磨 光 截面 估计 
HJ. 一 般 地 , 粉 状 材料 烧结 的 时 间 越 长 , 产品 中 固体 
成 分 会 越 多 .因此 , 我 们 预计 随 着 烧结 时 间 的 增加 ， 
SUP, 而 V, 增加 . 下 表 给 出 了 在 6 个 不 同 的 烧结 时 
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EFO, 100 个 烧结 镍 样品 的 Sy (em! / em? ) RI V, ( LZY 种 修改 ? 
EE) 的 样本 均值 和 样本 标准 差 . d. 考虑 V, 关于 烧结 时 间 x 的 二 次 模型 ,对 给 出 的 
时 间 Sy Vy 数据 拟 合 模 型 E( V.) = B, + Bix + Bx ,并 进行 

E 3M 4e 2E Fn 
EE Qum) sei SE SE RAE ASH DN. RH, HIA HUS 
minB V, HJ48. 
. . . .83 12 

2 wo 60 m» x» 1i o. 表 中 给 出 的 S, 的 标准 差 的 不 稳定 值 表明 e 
3 285 50.14 154.7 9.3 2.1 模型 很 可 能 违背 了 等 方差 的 标准 回归 假定 ,我 们 
4 1500 2995 161.0 97. 82 1.5 可 以 将 响应 变量 变换 成 一 个 具有 不 变 方 差 的 新 
5 4500 1650 110.4 9.0 1.3 的 响应 变量 来 满足 这 个 假定 条 件 . 考虑 自然 对 
6 1000.0 72.9 76.6 99. 49 1.1 PROSE = In( S, ) . 对 数据 拟 合 模型 有 S; ) - 


Bo tix, 并 给 出 最 小 二 乘 预 测 方程 . 

f. e 中 的 模型 对 预测 ln Sy) 合适 吗 ? 用 a = 0.05 
检验 . 

g. 参考 e 的 模型 . S, 的 预测 值 是 反对 数 : 


a 以 烧结 时 间 为 模 坐 标 , Sy 的 样本 均值 为 纵 坐标 
MHRA, W S, 的 样本 均值 与 烧结 时 间 x 之 
间 的 关系 假设 一 个 线性 模型. 

b. 以 烧结 时 间 为 横 坐 标 ,V, 的 样本 均值 为 纵 坐 标 


画 出 散 点 图 ,为 V, 的 样本 均值 与 烧结 时 间 < 之 Š, =e PV) 

间 的 关系 假设 一 个 线性 模型 为 了 得 到 S, 的 预测 区 间 , 需要 对 SI 的 预测 区 
c. WE ECS) 关于 烧结 时 间 x 的 线性 模型 ,说 明 数 间 端 点 取 反 对 数 。. 计算 烧结 时 间 为 150 min 时 ， 

据 可 能 违背 11.2 节 中 假定 . 你 建议 对 模型 做 何 Sy 的 95% 预测 区 间 . 


活动 中 的 统计 学 :高 速 公路 建造 业 中 的 串通 投标 

在 美国 , 商业 承包 商 为 建设 国家 高 速 公路 和 道路 进行 投标 . 国家 政府 机 构 , 通 党 是 交通 部 (DOT) 向 
各 个 承包 商 通 知 政府 建设 公路 的 意图 . 承包 商 提 交 窗 封 的 报价 ， 并 且 提 供 最 低 报价 (建设 费用 ) 的 承 
包 商 将 得 到 公路 建设 合同 . 在 竞争 市 场 中 , 投标 过 程 工作 得 很 好 ， 但 如 果 市 场 是 非 竞争 的 或 者 出 现 
相互 勾结 , 则 有 增加 建设 费用 的 可 能 性 . 20 世纪 80 年 代 在 佛罗里达 出 现 过 相互 勾结 的 情况 ,许多 公 
路 承包 商 承 认 或 被 发 现 有 罪 的 价格 制定 ， 即 制定 的 建设 费用 高 于 公平 、 或 通过 竞争 或 其 他 方式 竞争 
下 产生 的 价格 . 

活动 中 的 统计 学 包含 的 数据 由 佛罗里达 首席 检察 官 在 价格 制定 危机 发 生 时 突然 收集 的 . 首席 检 
察 官 的 目的 是 , 为 密封 投标 体制 竞 得 的 建设 公路 合同 的 费用 (y) 建立 一 个 模型 . 文件 FLAG 包含 了 
235 个 公路 合同 的 样本 数据 , 每 个 合同 测量 的 变量 列 在 表 SIALL. 1 rh. 首席 检察 官 最 终 是 想 利 用 这 个 
模型 预测 今后 国家 公路 合同 的 费用 . 

我 们 从 建立 数据 的 散 点 图 因 变 量 费用 (y) 关于 每 个 潜在 的 预测 变量 的 图 像 开始 分 析 , 它们 
显示 在 MINITAB 输出 图 SIA11. 1 中 . 我 们 还 慎重 地 建立 潜在 自 变量 的 相关 矩阵 以 检查 多 重 共 线 性 ， 
MINITAB 的 相关 和 矩阵 显示 在 图 SIA11. 2 中 ， 从 散 点 图 可 以 发 现 , 有 几 个 自 变量 , 如 DOT 工程 师 的 费 
用 佑 计 (DOTEST)、 工 作 日 估计 (DAYSEST) 、 周 定 或 竞争 的 投标 状态 (STATUS) 等 ,是 合同 成 本 好 的 
线性 预测 变量 . 然而 图 SIA11. 2 所 示 的 DOTEST 与 DAYSEST 的 相关 系数 + =0. 798 是 相当 高 的 值 .为 
了 避免 数据 中 存在 多 重 共 线 性 时 发 生 的 问题 , 将 拟 合 一 个 只 包括 两 个 自 变量 x, = DOT 费用 估计 和 








O 数据 和 试验 信息 由 刘 国 权 ( 音 译 ) 在 佛罗里达 大 学 访 学 时 提供 . 
O 为 了 看 对 数 变换 的 稳定 性 效果 , 可 以 用 计算 器 计算 表 中 给 出 的 Sy 标准 差 的 对 数 , 注意 , 变换 后 的 值 呈 现 较 小 的 变动 . 
O BRKE, 不 能 用 取 反 对 数 的 方法 求 平均 响应 E(y) 的 置信 区 间 , 这 是 因为 In( y) 的 平均 值 不 等 于 y 的 平均 值 的 自然 对 数 . 
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x, = 竞标 状态 的 回归 模型 (注意 ,竞标 状态 是 一 个 定性 变量 , 我 们 将 在 第 12 章 学 习 对 两 个 水 平 的 定 
性 自 变量 建立 “虚拟 ”变量 : 


X = 


f 如 果 固定 的 合同 
0 ”如 果 竞 争 的 合同 
表 SIA11. 1 FLAG 数据 文件 中 的 变量 





变量 名 类 型 描 述 变量 名 类 型 描述 
CONTRACT ”定量 《公路 合同 个 数 B3BIRAT EB 第 3 最 低 与 最 低 报 价 的 比 
COST 定量 《 低 报价 合同 费用 ( 千 美 元 ) BHBIRAT 定量 最 高 报价 与 最 低 报价 的 比 


DOTEST 定量 ” DOT 工程师 的 成 本 估计 ( 千 美元 ) DISTRICT 定性 ”公路 的 位 置 (1 = 南 佛罗里达 , 0 = 北 佛罗里达 ) 
STATUS 定性 ”投标 状态 (1 = 固定 的 , 0 = 竞争 的 ) | BTPRATIO 定量 竞标 者 的 人 数 与 计划 持 有 者 的 人 数 之 比 


B2BIRAT 定量 ”第 2 最 低 报 价 与 最 低 报 价 的 比 DAYSEST 定量 DOT 工程师 对 所 需 工 作 天 数 的 估计 


Matrix Plot of COST vs DOTEST, B2B1RAT, B3B1RAT 
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图 SIA11. 1 FLAG 数据 的 MINITAB 散 点 图 
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Matrix Plot of COST vs STATUS, DISTRICT 
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图 SIA11.1 ( 续 ) 














DOTEST B2B1RAT B3B1RAT BHB1RAT STATUS DISTRICT  BTPRATIC 
B2B1RAT -0.153 
B3BIRAT -0.242 0.535 
BHB1RAT -0.054 0.199 0.268 
STATUS -0.137 -0.117 -0.195 -0.149 
DISTRICT 0.251 0.081 -0.058 -0.132 0.097 
BTPRATIO -0.329 -0.139 -0.142 -0.022 0.001 -0.153 
DAYSEST 0.798 -0.113 -0.213 0.013 -0.113 0.193 -0.362 
Cell Contents:: Pearson correlation d 





图 SIA11.2 公路 建设 成 本 的 可 能 预测 变量 的 MINITAB 相关 矩阵 


首先 , 考虑 合同 费用 (y) 的 交互 作用 模型 ,模型 由 以 下 方程 给 出 ， 
E(y) =Bo * Byxi +B>x; * Bax x; 
模型 的 MINITAB 输出 如 图 SIA11. 3 所 示 . 图 中 显示 的 全 局 正统 计量 ( 严 =3281. 22) 和 关联 的 p 值 (z = 
0. 000) 表 明 , 整体 模型 对 预测 建设 成 本 是 统计 有 用 的 . R 值 表明 模型 能 解释 合同 成 本 中 样本 变异 的 
97.7% ,对 交互 作用 项 Bux, x, 的 了 检验 也 是 显著 的 (p = 0. 000)， 这 表明 合同 费用 (y) 和 DOT 成 本 估 
计 (%i ) 的 关系 依赖 于 投标 状态 (固定 的 或 竞争 的 ). 这 些 结果 对 利用 模型 进行 估计 和 预测 提供 了 统计 
上 强 有 力 的 支持 . 

交互 作用 的 实质 用 简化 模型 的 MINITAB 最 小 二 乘 预 测 方程 图 SIA11. 4 来 说 明 . 可 以 发 现 合 同 费 
用 (y) 随 DOT 工程师 费 用 估计 的 增长 率 , 固定 合同 比 竞争 合同 更 大 . 在 实际 利用 模型 之 前 , 我 们 必须 
检查 残 差 以 保证 标准 的 回归 假定 得 到 合理 的 满足 ， 

图 SIA11. 5 和 图 SIA11. 6 是 交互 作用 模型 的 MINITAB 残 益 图 . 图 SIAT1. 5 中 的 直方 图 表明 残 差 
近似 服从 正 态 分 布 , 因此 , 误差 服从 正 态 分 布 的 假定 合理 满足 . 然而 , 图 SIA11. 6 所 示 的 残 差 关于 7 
的 散 点 图 呈现 明显 的 “漏斗 形 ”, 这 表明 误差 的 方差 是 常数 的 假定 违背 了 . 一 种 使 模型 满足 这 个 假定 
的 修正 方法 是 对 成 本 (y) 进行 方差 稳定 化 变换 ( 如 自然 对 数 ). 当 回归 方程 中 两 个 变量 y fl x 都 是 经 
济 变量 (如 价格 、 成本、 薪水 等 ) 时 , 对 x 进行 变换 也 是 有 用 的 . 因此 , 我 们 将 通过 对 成 本 (y) 和 
DOTEST(x,) 都 取 对 数 变 换 来 修正 模型 . 
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The reqression equation is 


COST = - 6.4 + 0.921 DOTEST + 28.7 STATUS + 0.163 STA DOT 
Predictor Coef SE Coef T P 

Constant -6.43 26.21 -0.25 0.806 

DOTEST 0.921336 0.009723 94.75 0.000 

STATUS 28.67 58.66 0.49 0.625 

STA DOT 0.16328 0.04043 4.04 0.000 

3 = 296.600 R-8q = 97.74 R-Sq(adj) = 97.7% 


Analysis of Variance 





Source DF SS MS F P 
Regression 3 866540004 288846668 3281.22 D.ODD 
Residual Error 231 203349568 88030 

Total 234 886874973 








图 SIA11.3 成 本 的 交互 作用 模型 的 MINITAB 回归 输出 


Scatterplot of COST vs DOTEST 
STATUS: 1=FIXED, 0=COMPETITIVE 
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图 SIA11.4 交互 作用 模型 的 最 小 二 乘 预测 方程 的 MINITAB 图 


Histogram of the Residuals 
(response is COST) 
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图 SIA11.5 交互 作用 模型 的 MINITAB 残 差 直方 图 
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Residual 


Residuals Versus the Fitted Values 
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图 SIA11.6 交互 作用 模型 的 MINITAB 残 差 图 


修正 (log-log) 后 的 交互 作用 模型 形式 为 : 
E(y* ) =Bo +Bixr +B,x, +B3(xzr )xz 
其 中 y* = In( 成 本 ), xf = In(DOTEST). 模型 的 MINITAB 输出 如 图 SIA11.7 所 示 , 残 差 图 如 图 
SIA11. 8 和 图 SIA11. 9 所 示 . 图 SIA11. 8 中 的 直方 图 近似 正 态 , 更 为 重要 的 是 图 SIALL 9 中 的 残 差 散 
点 图 没有 明显 的 趋势 . 这 表明 对 数 变换 成 功 地 稳定 了 残 差 方 益 . 

然而 , 注意 模型 中 交互 作用 项 的 ;检验 (在 图 SIAL. 7 中 着 重 表示 ) 不 再 显著 (p = 0.420). 因此 ， 
我 们 要 从 模型 中 删除 交互 作用 项 并 利用 更 简单 的 修正 模型 . 





* _ * 
E(y* ) 2p * ixi * Box; 
3 ML 
来 预测 公路 建设 成 本 . 
[ 
The regression equation is 
LNCOST = - 0.162 + 1.01 LNDOTEST + 0.324 STATUS - 0.0176 STA LNDOT 
Predictor Coef SE Coef T P 
Constant -0.16188 0.05193 -3.12 0.002 
LNDOTEST 1.00780 (0.00798 126.23 0.000 
STATUS 0.3243 B.1356 2.39 0.018 
STA LNDOT -0.01762 0.02181 -0.81 0.420 
5 = 0.154922 R-Sq = 98.85 R-Sq(adj) = 98.75 
Analysis of Variance 
Source DF SS MS F P 
Regression 3 439.64 146.55 6105.87 0.000 
Residual Error 231 5.54 0.02 
Total 234 445.18 














SIA11.7 公路 合同 费用 的 修正 的 (log-log) 交互 作用 模型 的 MINITAB 回归 输出 
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图 SIA11.8 修正 (log-log) 模 型 的 MINITAB 残 差 直方 图 


Residuals Versus the Fitted Values 
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图 SIA11.9 修正 (log-log) 模 型 的 MINITAB 残 差 图 


不 含 交互 作用 项 的 修正 模型 的 MINITAB 输出 结果 显示 在 图 SIAI. 10 rp. 最 小 二 乘 预测 方程 为 


In(y) = -0.147+1.011n(x,) +0. 217%, 


假定 想 预 测 当 DOT 估计 是 370 000 美元 ( 即 x, =370) 且 合同 固定 ( 即 x, =1) 时 的 公路 建设 费用 . 


因为 In(370) =5.91 


,将 这 些 值 代入 预测 方程 中 , 得 
In(y) = -0.147+1.0lln(xi ) +0. 217x, = -0.147 & 1.01(5.91) +0.217(1) =6.02 


为 了 将 这 个 预测 的 自然 对 数值 转化 成 千 美 元 , 我 们 取 反 对 数 ，e6 吧 =411.6. 因此 , 对 DOT 费用 估计 
为 370 000 美元 固定 的 道路 合同 , 模型 预测 的 建设 费用 为 411 600 美元 . 

项 测 的 In(y) 和 相应 的 95% 预 测 区 间 (5.71, 6. 32) 显示 (着 重 ) 在 MINITAB 输出 图 SIA11. 10 的 
底部 , 通过 取 区 间 端 点 的 反对 数 , 得 到 e5 7 2301.9 A e63? = 555.6. 因此 , 模型 预测 (以 95% 的 置 
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信 ) 对 DOT 费用 估计 为 370 000 美元 的 固定 的 公路 合同 费用 落 在 301 900 ~ 555 600 美元 之 间 . 注意 
顶 测 区 间 的 宽阔 范围 , 这 是 由 于 相对 较 大 的 模型 标准 差 ;. 尽管 模型 对 预测 合同 费用 似乎 是 统计 有 用 
的 , 但 可 能 不 是 “实际 "有 用 的 . 为 了 减少 ; 的 大 小 ， 佛罗里达 首席 检察 官 需要 提高 模型 的 预测 能 力 . 





The regression equation is 


LNCOST = - 0.147 + 1.01 LNDOTEST + 0.217 STATUS 
Predictor Coef SE Coef T P 
Constant -0.14684 0.04846 -3.03 0.003 
LNDOTEST 1.00543 0.00742 135.45 0.000 
STATUS 0.21656 0.02475 8.75 0.000 

3 = 0.154773 R-Sq = 98.85 R-Sq(adj) = 98.7% 
Analysis of Variance 





Source DF SS BS F P 
Regression 2 439.61 219.80 9175.83 0.000 
Residual Error 232 5.56 0.02 

Total 234 445.16 


Predicted Values for New Observations 
Neu 


Obs Fit SE Fit 955 CI 859 PI 
1 6.0152 20.0219 (15.9720, 5.0584) (15.9092, 6.3232] 


Values of Predictors for New Observations 








New 
Obs LNDOTEST STATUS 
1 5.91 1.00 | 





图 SIA11. 10 公路 建设 费用 的 较 简单 的 修正 (log-log) 模 型 的 MINITAB 回归 输出 


第 12 章 模型 构建 


目标 ”说明 为 什么 线性 模型 的 确定 性 分 量 对 于 获得 好 的 预测 方程 非常 重要 . 给 出 一 些 基本 概 ; 
和 构造 好 的 线性 模型 的 方法 . 


12.1 引言 : 为 什么 模型 构建 是 重要 的 


在 第 10 ~ 11 章 我 们 已 经 强调 了 构造 一 个 回归 模型 的 第 一 步 是 概率 模型 确定 性 分 量 的 假设 形 
式 . 模型 的 建立 , 或 模型 构造 是 回归 分 析 成 功 (或 者 失败 ) 的 关键 一 步 . 如 果 假 设 的 模型 不 能 反映 ， 
或 至 少 不 能 近似 地 反映 平均 响应 E(y) 和 自 变 量 x ox, ，…， x, 之 间 关 系 的 真实 情况 , 建 模 将 是 不 
值得 的 . 

建立 模型 意味 着 构造 一 个 模型 , 它 能 为 一 组 数据 提供 好 的 拟 合 ， 对 y 的 均值 给 出 好 的 估计 , EDGE 
于 给 定 的 自 变 量 值 , 给 出 未 来 y 值 的 好 的 预测 . 例如 ， 假定 想得到 某 种 塑料 的 断裂 强度 y 与 生产 塑料 
时 的 压强 x 之 间 的 关系 ,而 我 们 不 知道 二 阶 模型 

E(y) 2 Bo +Bix + B,x2 

可 以 使 我 们 得 到 误差 很 小 的 y 的 预测 ( 见 图 12. 1a). 遗憾 的 是 ， 错误 地 选择 了 一 阶 模型 


> 


G 

















E(y) =Bo *Bix 
来 解释 x 和 yy 之 间 的 关系 ( 见 图 12. 1b). 

y y 
E de 
Ed pa 
ER R 
EJ E 

x X 
压强 压强 
a) 二 阶 模型 b) 一 阶 模型 


图 12. 1 联系 断裂 强度 y 和 压强 x 的 两 个 模型 


对 比 图 12. 1a 和 图 12. 1b 可 以 清楚 地 看 到 选择 错误 模型 的 结果 . 与 一 阶 模型 相 比 ， 二 阶 模型 的 预 
测 误差 相对 较 小 . 这 个 简单 例子 的 教训 是 明显 的 ,选择 一 组 合适 的 自 ( 预 测 ) 变 量 Xis X3, c, Xy 不 能 
保证 好 的 预测 方程 ,除了 选择 包含 关于 y 某 种 信息 的 自 变量 ， 还 必须 指定 一 个 能 联系 y Toa ,x2 ，…， 
xy 的 公式 ,为 那些 数据 提供 一 个 好 的 拟 合 . 

本 章 将 讨论 多 元 回归 分 析 中 最 复杂 的 一 部 分 一 一 E(y) 的 好 模型 形式 ， 尽管 在 这 一 章 里 提出 的 几 
个 模型 已 经 在 第 11 章 里 介绍 过 ， 还 是 假定 读者 很 少 或 没有 建立 模型 的 基础 知识 ,本 章 将 为 多 元 回归 
使 用 者 建立 模型 提供 基本 指导 . 
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12.2 自 变量 的 两 种 类 型 : 定量 的 和 定性 的 
回想 第 1 章 , 在 实际 背景 下 产生 的 两 种 数据 类 型 : 定量 的 和 定性 的 . 对 于 这 里 所 考虑 的 回归 分 析 
类 型 , 因 变量 总 是 定量 的 , 但 是 自 变量 可 以 是 定量 的 ， 也 可 以 是 定性 的 ,如 下 面 所 述 , 自 变 量 进入 模 
型 的 方式 依赖 于 它 的 类 型 . 这 里 再 次 陈述 第 1 章 的 定量 变量 和 定性 变量 的 定义 . 
定义 12.1 定量 自 变 量 是 可 能 取 值 相应 于 直线 上 的 点 的 数值 的 变量 ;不 是 定量 变量 的 自 变量 称 
计算 机 开始 处 理 数据 之 前 的 等 竺 时间、 一 件 产品 上 的 甫 疫 数 和 每 天 用 电 的 度数 都 是 定量 自 变量 的 
例子 . 另 一 方面 ， 回想 在 污染 的 田纳西 河 发 现 的 三 种 类 型 的 鱼 (海峡 铃 鱼 、 大 嘴 鲈 鱼 和 小 口 胭脂 鳃 ). 种 
类 作为 一 个 变量 是 定性 的 ， 因为 它 不 能 由 一 个 数值 尺度 来 度量 . 由 于 不 同 种 类 的 鱼 可 能 有 不 同 的 DTT 
污染 水 平 , 因此 把 它 作为 田纳西 河中 鱼 的 平均 DTT 污染 水 平 y 的 预测 模型 里 的 一 个 自 变量 . 
定义 12.2 自 变量 的 不 同 的 强度 设置 称 作 水 平 . 
对 于 一 个 定量 自 变量 , 水 平 相应 于 可 能 的 取 值 . 例如 ， 如 果 一 个 产品 的 环 疲 数 范围 是 0 ~3, 那么 
自 变 量 有 4 个 水 平 0, 1,2 f3. 
定性 变量 的 水 平 不 是 数值 的 , 只 能 通过 它们 的 描述 来 定义 . 例如 ， 在 三 个 水 平 : 海峡 铃 色 、 大 嘴 
鲈鱼 、 小 口 胭脂 鱼 观测 鱼 种 类 自 变 量 . 
假定 我 们 的 任务 是 预测 一 家 高 科技 公司 全 体 行政 人 员 的 薪水 , 它 是 下 面 4 个 自 变量 的 函数 ， 
a. 员工 的 经 验 (年 数 ). 
b. 员工 的 性 别 . 
c. 公司 的 净 资 产值 . 
d. 员工 的 等 级 . 
对 于 每 一 个 自 变量 , 给 出 它 的 类 型 并 描述 你 期 望 观察 到 的 水 平 . 
解 
a. 自 变 量 “ 经 验 ” 是 定量 的 , 因为 它 的 取 值 是 数值 的 . 我 们 期 望 观察 的 水 平 范 围 是 (大 概 )0 ~ 
40 年 . 
b. B 2E TR" 性别? 是 定性 的 ， 因为 它 的 水 平 只 能 通过 非 数值 标记 “ 女 ” 和 “ 男 ” 来 描述 . 
c. 自 变量 “公司 的 净 资 产值 "是 定量 的 ， 它 有 相应 于 表示 不 同 公司 净 资产 值 的 美元 价值 范围 的 很 
多 可 能 水 平 . 
d. 假定 自 变量 “员工 的 等 级 ”在 三 个 水 平 观测 主管 、 助 理 副 总 经 理 、 副 总 经 理 ， 因为 不 能 对 每 
一 个 职位 的 相对 重要 性 指定 一 个 具体 的 数值 度量 ， 因此 等 级 是 一 个 定性 自 变 量 . 
在 回归 模型 中 ， 定量 自 变量 和 定性 变量 的 处 理 方法 是 不 同 的 ,下 一 节 将 开始 讨论 怎样 在 建 模 中 
使 用 定量 变量 . 
应 用 练习 a. 指出 此 项 研究 中 的 因 变 量 y. 
12.1 雨水 的 化 学 成 分 . 亚 伯 丁 (苏格兰 ) 大 学 的 研 。 ”指出 自 变量 及 其 类 型 (定量 的 或 定性 的 ). 
究 者 提出 了 一 个 估计 水 的 化 学 成 分 统计 模型 (Jour- 12.2 "RJ 55 85 iX 3m. 在 Journal of Applied Ecology 
nal of Agricultural, Biological, and Environmental Sta- (Vol 32, 1995) 中 写 道 ， 植物 学 家 用 多 元 回归 作为 喂 
tistics, 2005 年 3 月 ) ,一 个 应 用 是 对 大 雨 之 后 采集 养 试 验 中 幼 白 筷 体 重 变化 (y) 的 模型 . 这 里 列 出 了 三 
的 水 样本 中 的 硝酸 盐 浓 度 (mg/L) 作 为 水 源 ( 地 下 个 自 变量 ,把 每 个 变量 分 类 为 定量 的 或 定性 的 . 
水 , 地 表 水 或 者 地 上 水 ) 的 函数 建 模 . a. 食物 类 型 (植物 或 者 鸭 食 ). 
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b. 消化 率 (百分比 ). 
c. 添加 到 食物 中 的 酸性 纤维 量 (百分比 ). 

12.3 消防 员 的 情感 压力 . Journal of Human Stress 
(1987 年 夏 ) 刊 载 了 关于 “消防 员 面 对 化 学 火灾 时 
的 心理 反应 ”. 作为 以 下 自 变 量 的 函数 , 研究 者 用 
多 元 回归 来 预测 情感 压力 . 指明 每 个 自 变 量 是 定量 
的 或 者 定性 的 ,对 于 定性 变量 , 给 出 可 能 观察 的 几 
个 水 平 ,对 于 定量 变量 , 给 出 可 能 观测 的 变量 值 
(水 平 ) 的 范围 . 

. 以 前 发 生 的 心理 症状 数量 . 

. 经 验 年 数 . 

吸烟 行为 . 

. 社会 援助 的 水 平 . 

婚姻 状况 . 

年 龄 . 

民族 . 

教育 水 平 . 


.3 一 元 定量 自 变量 模型 


== m m e a ° m= b 


= 
N 


12.4 


j. 居住 地 与 事故 发 生地 的 距离 . 

k. 性 别 . 

荒原 的 层 流 率 . 进行 一 项 试验 来 研究 荒原 种 植 
植物 的 层 流 率 . 将 下 面 的 每 个 自 变量 分 类 为 定量 的 
或 定性 的 , 并 且 指 出 变量 可 能 取 到 的 水 平 . 

a. ENE. 

b. 种 植 方法 . 

d. 草 坡 斜率 . 

e. 草皮 类 型 . 


12.5 有 机 蒸汽 的 吸附 率 . Environmental Science & 


Technology (1993 年 10 月 ) 刊 载 了 一 篇 研究 影响 有 
机 蒸汽 吸附 黏土 矿 变量 的 文章 . 这 里 列 出 研究 中 考 
虑 的 自 变量 和 水 平 , 指出 每 个 变量 的 类 型 (定量 的 
或 者 定性 的 ). 

a. TARE(SO'F , 60'F , 75"F, 90'F). 

b. 相对 湿度 (30% , 5096 , 7096). 

c. 有 机 化 合 物 ( 葵 MÆ, A, PE, ER). 


联系 y 和 单个 定量 自 变量 % 的 最 常见 的 线性 模型 是 多 项 式 表 达 式 . 下 面 框 格 给 出 由 某 个 指定 的 P 


值得 到 的 具体 模型 . 

















其 中 也是 正 整数 , B, Bio ts B, 是 必须 估计 的 未 知 参数 . 





一 元 p 阶 多 项 式 
E(y) =B * Bix +Bax +Byx e +B, 








模型 参数 的 解释 如 下 : 
Bo: y RIE; x cO 时 五 (y) 的 值 . 
Bi: 直线 的 斜率 ; x 每 增加 一 单位 , Ey) mad qb. 





一 元 一 阶 ( 直线 ) 模型 
E(y) -By *Byx 








在 希望 预测 y 的 * 值 范围 内 ,期望 x 每 变化 一 个 单位 , y 的 变化 率 保持 相当 稳定 , 用 一 阶 模型 ( 见 


图 12. 2) 建 模 . E(y)#lx 之 间 的 大 部 分 关系 是 曲线 的 ， 


但 是 在 希望 预测 y 的 x 范围 上 曲率 可 能 很 小 ， 


在 这 种 情况 下 , 一 阶 (直线 ) 模 型 可 以 很 好 地 拟 合 数据 . 





模型 参数 的 解释 如 下 : 
fo: y ARE; x=0 时 E(y) 的 值 . 





fi: 曲率 . 


一 元 二 阶 模型 
E(y) =B *Bix +B% 


Bi: EBER, DUE B, 值 使 抛物 线 向 右 或 向 左 移动 (增加 Bi 值 使 抛物 线 向 右 移动 ). 
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二 阶 模型 的 图 形 是 一 条 开口 向 下 (B: <0) 或 向 上 (8 >0) 的 抛物 线 , 如 图 12.3 所 示 . 因为 大 多 数 
关系 都 具有 某 种 弯曲 , 因此 二 阶 模型 是 联系 y 与 x 的 好 的 选择 . 
一 元 三 阶 模型 
E(y) =B *Bix +B: +B? 





模型 参数 的 解释 如 下 : 

By: y WRH; x cO 时 E(y) 0948. 

Bi: 位 移 参 数 ( 多 项 式 在 x 轴 上 向 左 或 向 右 移动 ). 
B,: 曲率 . 

Bs: B, 的 大 小 控制 曲线 的 曲率 正 负 之 间 转 换 速 度 . 


曲率 的 变 号 不 是 很 常见 , 但 这 样 的 关系 可 以 用 三 阶 或 者 更 高 阶 多 项 式 建 模 . 如 图 12.3 中 看 到 
的 ,一 个 二 阶 模型 的 曲率 不 会 变 号 , 随 * 增 大 斜率 连续 增 大 或 者 减 小 , 产生 一 个 槽 (最 小 值 ) 或 者 一 个 
峰 (最 大 值 ). 一 个 三 阶 模型 (如 图 12. 4) 包含 一 次 曲率 正 负 间 的 转换 就 产生 一 个 槽 和 -一 个 峰 , 一 般 地 ， 
Pp 阶 多 项 式 的 图 至 多 包含 (p - 1) EE IB. 

EG) E(y) 














i Bi«0 I 














图 12.3 二 阶 模型 图 形 





图 12.2 一 阶 模型 图 形 


E(y) 











图 12.4 两 个 三 阶 模型 的 图 形 
现实 中 的 大 部 分 函数 关系 看 上 去 都 是 光滑 的 (除了 随机 误差 ) , 即 它们 不 会 在 方向 上 呈 快 速 且 不 
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规则 的 正 负 间 的 转换 ,因此 , 二 阶 多 项 式 模型 也 许 在 前 面 叙述 过 的 模型 中 是 最 有 用 的 . 为 了 更 好 的 理 
解 如 何 使 用 这 个 模型 , 考虑 下 面 的 例子 . 

为 了 更 有 效 地 工作 , 电力 公司 必须 能 预测 他 们 各 个 站 点 的 高 峰 电力 负荷 ,高 峰 电 力 负荷 是 
每 天 为 了 满足 需求 所 必须 发 电 的 最 大 值 . 在 需求 量 最 大 的 夏季 , 电力 公司 希望 用 日 高 温 * 建立 高 峰 电力 
负荷 y 的 模型 . 尽管 公司 预期 当 温 度 增加 时 负荷 峰值 也 增加 , 但 当 增加 时 ，E(y) 的 增加 速度 可 能 不 会 
保持 不 变 ,例如 ， 当 100 ~ 101 下 高 温 下 增加 一 个 单位 , 可 能 比 80 ~81 下 下 增加 一 个 单位 所 需要 的 用 电量 
E. 因此 , 公司 认为 E(y) 的 模型 应 该 包括 二 阶 (平方 ) 项 , 可 能 的 话 , 也 包括 三 阶 (立方 ) 项 

选取 25 天 夏 日 的 随机 样本 记录 每 天 高 峰 负荷 (MW) 和 高 温 ( °F ) ,数据 列 在 表 12. 1L. 


表 12. 1 电力 负荷 数据 





温度 ( 下 ) 高 峰 负荷 (MW) | ”温度 (下 ) 高 峰 负荷 (MW) 温度 ( F) 高 峰 负荷 (MW) 

94 136.0 106 178.2 76 100. 9 

96 131.7 67 101.6 68 96.3 

95 140.7 71 92.5 92 135.1 
108 189.3 100 151.9 100 143. 6 

67 96. 5 79 106. 2 85 111.4 

88 116.4 97 153.2 89 116. 5 

89 118. 5 98 150. 1 74 103. 9 

84 113.4 87 114. 7 86 105. 1 

90 132. 0 














a. 画 数据 的 散 点 图 ,图 提示 是 哪 种 类 型 的 模型 ， | 
b. 用 三 阶 模型 E(y) 2 Bo * Bix +B; +B, 拟 合 数据 ,是 否 有 证 据说 明 三 次 项 px? 为 预测 高 峰 
电力 负荷 提供 了 信息 ? 取 o =0.05. 
c. 用 二 阶 模型 Ely) = Bo + Bux + Bax? 拟 合 数据 ,检验 电力 负荷 的 增长 率 随 着 温度 的 增高 而 增 大 
的 假设 , 取 a =0. 05. 
d. 给 出 c 中 二 阶 模型 的 预测 方程 ,是 否 满意 用 这 个 模型 来 预测 高 峰 电力 负荷 ? 
解 
a. 用 MIBITAB 产生 如 图 12.5 所 示 的 数据 散 点 图 , 非 线性 且 向 上 弯曲 的 趋势 表明 二 阶 模型 可 能 
很 好 的 拟 合 数据 . 
b. 用 MINITAB 的 三 阶 模型 拟 合 数据 , 结果 如 图 12. 6 所 示 . 检验 
Ho : Bs =0 
H,: Bs #0 
的 p 值 在 输出 中 着 重 显 示 为 0. 911. 因为 p 值 大 于 w = 0. 05, 因此 没有 充分 的 证 据 表明 高 峰 负荷 和 高 
温 之 间 具 有 三 阶 关系 . 所 以 ， 将 从 模型 中 去 掉 三 次 项 g,x5. 
c. 用 MINITAB 的 二 阶 模型 拟 合 数据 ,输出 结果 如 图 12.7 所 示 . 对 这 个 二 次 模型 ,如果 6, EE 
的 ,那么 高 峰 电 力 负荷 y 的 增长 率 随 温度 * 增加 而 增加 . 所 以 , 我 们 检验 
Hy: B, =0 
H,: B, >0 
图 12.7 着 重 显示 检验 统计 量 T =7. 93 RIY p 值 . 因为 单 人 出 p 值 p =0/2 =0 小 于 a=0.05, 我 们 拒绝 
,断言 高 峰 电 力 负荷 的 增长 率 随 着 温度 的 增加 而 增加 . 
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200 


190 


LOAD 


100 


The regression 


TEMP 
E 12.5 电力 负荷 数据 的 MINITAB 散 点 图 








equation is 


LOAD = 331 - 6.4 TEMP + 0.038 TEMP2 40.000084 TEMP3 


Predictor 
Constant 
TEMP 
TEMP2 


Coef SE Coef 
331.3 477.1 
-6.39 16.79 

0.0378 0.1845 


TEMP3 0.0000843 . 0.0007426 


8 = 5.501 


R-3q = 95.95 


Ànalysis of Variance 


Source 
Regression 
Residual Error 
Total 


图 12. 


The regression 
LOAD = 385 - 8. 


Predictor 
Constant 

TEMP 

TEMPZ 0. 


8 = 5.376 


DF E 
15012.2 

635.5 

15647.7 


T 
0.69 
-0.38 
0.19 
0.11 


R-Sq(adj)) = 


NS 
5004.1 
30.3 


F 
165.36 


6 电力 负荷 三 阶 模型 的 MINITAB 输出 结果 


equation is 
29 TEMP + 0.0598 TEMPZ 


Coef SE Coef 
385.05 55,17 
-8.293 1.299 


059823 0.007549 


R-S8q = 95.95 


Ànalysis of Variance 


Source 
Regression 
Residual Error 
Total 


DF 3S 

z 15011.8 
22 635.9 
24 15647.7 





P 
0.000 








T 
6.98 
-6.38 

3.93. 


R-Sq(adj] = 


MS 
7505.9 
28.9 


P 
8.000 
0. 000 
8.000 





95.65 


F 
259.69 


图 12.7 电力 负荷 二 阶 模型 的 MINITAB 输出 结果 


P 
0.000 
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(2) 应 用 练习 


12.6 确认 多 项 式 . 下 面 的 图 描述 了 一 元 p 阶 多 
项 式 . 
i. E(y) H. E(y) 


~ 


a. 指出 每 个 图 中 多 项 式 的 阶 数 . 

b. 利用 参数 B, , Bi. B 等 , 写 出 联系 E(y) fl x 的 
模型 . 

c. b 的 模型 中 许多 参数 的 符号 ( + 或 者 - ) 可 以 通 
过 检查 图 确定 . 指出 可 以 确定 的 参数 符号 . 

12.7 用 图 表示 多 项 式 . 用 图 表示 下 面 的 多 项 式 , R 
后 在 图 上 指出 每 个 多 项 式 阶 数 : 

a. E(y) =2 *3x. 

b. E(y) 22 * 3X. 

c. E(y) 21 42x «2x? +°. 
d. E(y) 2x 42x? +. 

e. E(y) 22 - 3x7. 

f. E(y) = -2 43x. 

12.8 佛罗里达 州 湿 地 水 中 的 叶绿素 . 佛罗里达 大 西 
洋 大 学 有 机 地 球 化 学 小 组 研究 了 佛罗里达 湿地 水 
中 光合 色素 (Florida Scientist, 2004 年 秋 ). 研究 人 
员 用 两 种 方法 ; 分 光 光 度 测定 法 (y) 和 高 效 液 相 色 
谱 法 (x) 测 量 从 佛罗里达 海湾 采集 的 1 工 水 中 的 叶 
绿 素 含量 . 

a. 写 出 £(y) 的 一 阶 ( 直线) 模型. 解释 模型 里 的 B. 

b. 理论 上 ,如 果 在 水 样品 中 没有 叶绿素 , 那么 x = 
0, y=0. 假定 直线 通过 原点 (0, 0) , 重新 写 出 a 
中 的 模型 . 

c. 写 出 E(y) 的 二 阶 (平方 ) 模 型 . 

d. 如 果 理 论 表 明 随 着 高 效 液 相 色谱 测量 值 (x) 的 增 
加 , 分 光 光 度 测 量 值 (y) 以 递减 的 速度 增加 , 那 
Z c 中 模型 里 的 B, 的 符号 是 什么 ? 

12.9 有 机 蒸汽 的 吸附 作用 . 考虑 练习 12.5, Eni- 


ronmental Sciende & Technology 中 的 关于 有 机 蒸汽 

的 吸附 研究 , 考虑 将 蒸汽 保持 系数 y 作为 两 个 定量 

自 变 量 温度 (x ) 和 相对 湿度 (x, ) 之 一 的 函数 建 模 . 

a. 假设 在 平均 保持 系数 E( y) 和 相对 湿度 x, 之 间 
有 曲线 关系 . 建立 一 个 模型 ， 并 画 出 模型 草图 . 

b. 假设 平均 保持 系数 E(y) 和 温度 x, 之 间 有 三 阶 
关系 . 建立 一 个 模型 , 并 画 出 模型 草图 . 

12.10 ”塑料 的 强度 . 在 生产 某 种 塑料 时 所 用 的 压力 
大 小 认为 与 塑料 的 强度 有 关 . 研究 者 认为 , 随 着 压 
力 增 大 , 塑料 的 强度 也 增加 ,直到 压力 增 大 将 对 塑 
料 强度 产生 有 害 影 响 的 某 点 . 写 出 一 个 联系 塑料 强 
BE y 和 压力 x 的 模型 来 反映 这 种 信念 , 画 出 模型 
草图 . 

12.11 免疫 力 和 锻炼 . 锻炼 能 改善 人 类 的 免疫 系统 
吗 ? 佛罗里达 大 学 的 生理 学 家 做 了 一 个 试验 来 确 
定 是 否 存在 这 样 的 关系 . 30 个 试验 志愿 者 参加 这 
项 研究 ,记录 每 个 试验 者 的 免疫 球 蛋白 数量 IgG( 长 
期 免疫 力 的 指标 ) 和 氧气 摄取 的 最 大 值 ( 需 氧 适合 
水 平 的 度量 ) ,数据 在 下 面 的 表 中 给 出 . 











"m 
志愿 者 JG y 氧气 摄取 的 志愿 者 Cy 氧气 摄取 的 
最 大 值 x 最 大 值 x 

1 881 34.6 16 1660 52.5 

2 1290 45.0 17 2121 69.9 

3 2147 62.3 18 1382 38.8 

4 1909 58.9 19 1714 50.6 

5 1282 42.5 20 1959 69.4 

6 1530 44.3 21 1158 37.4 

7 2067 67.9 22 965 35.1 

8 1982 58.5 23 1456 43.0 

9 1019 35.6 24 1273 44.1 

10 1651 49. 6 25 1418 49.8 

11 752 33.0 26 1743 54.4 

12 1687 52.0 27 1997 68.5 

13 1782 61.4 28 2177 69. 5 

14 1529 50.2 29 1965 63.0 

15 969 34.1 30 1264 43.2 


a. 构造 一 个 IgG -最 大 氧气 摄取 数据 的 散 点 图 . 
b. 提出 联系 IgG 和 最 大 氧气 摄取 量 的 概率 模型 . 
c. 用 此 模型 拟 合 数据 并 给 出 最 小 二 乘 预测 方程 . 
d. 评价 模型 的 恰当 性 . 

12.12 ” 蛙 的 视 动 反应 .Journal of Experimental Zoolo- 
gy (1993 年 9 月) 研究 了 树 峙 的 视 动 反应 . 用 显 微 
荧光 分 光度 测定 法 测量 在 不 同 光谱 波长 下 检测 的 
树 蛙 的 门限 量子 通 量 ( 第 一 次 观测 到 视 动 反应 时 的 
光 强 ). 数据 显示 量子 通 量 的 对 数 (y) 和 波长 (x) 之 


P d Ax 
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y 深度 (m) MECC) URBE (m) 温度 (人 ) 

19. 60 -28. 77 7.90 -29.41 

x4 15. 00 -28. 84 7.00 -29. 56 

g 14. 00 -28. 88 6. 00 - 29. 68 

= 13. 80 -28. 89 5.00 - 29. 68 

x 13.00 -28. 90 4. 00 -29.39 

12. 35 -28. 93 3. 00 -28.33 

EKG 12. 00 —28. 94 2. 00 -25. 24 

11.00 -29.02 2. 00 -25.19 

间 的 关系 如 上 图 所 示 ,为 E( y) 假设 一 个 对 应 于 图 10.00 -29.11 2.00 -25.25 
形 的 模型 9. 00 -29. 25 

12.13 空气 污染 模型 . 经 常 签署 发 电厂 的 空气 污染 


调整 契约 , 使 得 随 着 工厂 产量 增加 , 可 以 排放 的 最 
大 污染 量 也 增加 . 假设 这 是 真 的 , 写 一 个 联系 允许 
的 最 大 污染 量 ( 每 百 万 分 之 一 ) 和 工厂 产量 ( 百 万 
R.) 的 模型 . 

12.14 ”冰川 雪 坑 温度 . 新 汉 普 郡 大 学 国家 冰雪 数据 
中 心 从 一 个 冰川 雪 坑 采集 了 冰 核 样本 的 温度 数据 . 
冰 核 样本 是 2 ~ 175.5 m 的 深度 中 采集 的 ,深度 在 
20 m 以 内 的 数据 列 在 下 表 中 . 

a. 画 出 数据 的 散 点 图 , y 轴 为 温度 , x 轴 为 深度 . 观 
测 到 怎样 的 趋势 ? 

b. 提出 一 个 认为 可 以 拟 合 数据 的 E( y) 的 多 项 式 模 
型 . 模型 是 几 阶 的 ? 

c. 用 最 小 二 乘法 以 b 中 的 模型 拟 合 数据 , 评价 模 
型 的 恰当 人 性. 


资料 来 源 : Mayewski, P. 
snow pit and ice core. " 


Boulder, CO. , 2000. 


12.15 工作 产 出 研究 . 一 位 工程 师 提 出 下 面 模型 来 
描述 在 某 生 产 过 程 中 每 天 生产 的 接受 产品 数量 ( 产 
tH) 和 每 天 花费 的 工作 小 时 数 (投入 ) 之 间 的 关系 ， 

y=Bo *Bix Bx! +e 

其 中 ,y = 每 天 生产 的 接受 产品 数量 ,x = 每 天 的 工 
作 小 时 数 . 下面 给 出 用 这 个 模型 拟 合 25 周 生 产 数 
据 样本 结果 的 MINITAB 输出 的 一 部 分 . 检验 假设 : 
随 投 入 量 的 增加 , 产 出 量 以 一 个 递减 的 速度 增加 . 
这 些 数据 是 否 提供 了 充分 的 证 据 证 明 在 投入 增加 
时 , 投入 每 增加 一 个 单位 产 出 的 增加 速度 在 减少 ? 
Hia 20.05 检验 . 


, and Whitlow, S. “Newall glacier 


National Snow and Ice Data Center, 











r— 
The regression equation is 
Y = -6.17 + 2.04 X1 - .0323 X2 
Predictor Coef SE Coef T P 
Constant -6.173 1.666 -3.71 0.002 
Z1 2.036 .185 11.02 0.000 
X2 -.03231 ,. 00489 -6.60 0.000 
8 = 1.233 R-Sq = 95.5* R-Sq(adj) = 95,15 
Analysis of Variance 
Source DF SS MS F P 
Regression 2 "718.168 359.08 232.41 0.000 
Residual Error 22 33.992 1.545 

| Total 24 752.160 | 








5&5] 12. 15 的 MINITAB 输出 
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12.4 ”二 元 定量 自 变量 模型 
就 像 单 个 定量 自 变量 模型 一 样 , 两 个 定量 自 变量 模型 分 为 一 阶 , 二 阶 等 ,因为 在 实践 中 很 少 遇 到 
三 阶 或 者 更 高 阶 的 关系 ,因此 我 们 集中 讨论 一 阶 和 二 阶 模型 . 


二 元 一 阶 模型 
E(y) =Bo +B,x, +B,x, 





模型 参数 的 解释 如 下 : 

Bo: 平面 的 y 轴 截 距 ( 见 图 12.8); BU z, =x, =0 H E(Q) Idi 
Pi: x RETA, x 增加 1 单位 时 的 EE(y) 变 化 . 

By: x, 保持 不 变 , x, 增加 1 o EO) 变化. 


图 12.8 表明 了 一 个 响应 曲面 (对 照 联系 EO) 和 单个 定量 变量 的 响应 曲线 ). 特别 地 ， 联系 E(y) 
和 两 个 定量 自 变 量 x, 和 x, 一 阶 模型 的 图 形 是 三 维 空间 中 的 平面 . 这 个 平面 描绘 了 每 个 取 值 相应 于 
(ai, 22 TELE SE Gn, xs) ER EOE. 在 现实 世界 中 , 大 部 分 响应 面 有 很 好 性 质 (光滑 ) ,并 且 
是 弯曲 的 . 因此 ,只 有 响应 曲面 在 你 感 兴趣 的 (x1 ,xz ) 区 域 上 相当 平坦 时 ， 一 阶 模型 才 是 合适 的 . 

假定 一 阶 模型 能 够 合理 地 描述 E(y) 和 变量 x, #l x, 之 间 关 系 ,等 价 于 假定 x 与 x, 没有 “交互 
作用 ”; 即 假定 xı 变化 (对 x 的 某 个 固定 值 ) 对 E(y) 的 影响 是 相同 的 , 不管 % 的 值 是 多 少 ( 反 之 亦 
R). 因此 ,“ 无 交互 作用 ”等 价 于 使 一 个 变量 (如 x ) 的 变化 对 EC) 的 影响 与 第 二 个 变量 (如 x) 是 
无 关 的 . 例如 ， 如 果 我 们 给 一 阶 模型 中 的 x 赋值 , 作为 xi 的 函数 E(y) 将 产生 如 图 12.9 所 示 的 平行 
A. 这 些 直 线 称 为 等 高 线 , 表示 当 曲 面 被 三 个 平面 切片 时 的 等 高 线 ， 这 三 个 平面 都 与 平面 [E(y)， 
x DEI, 与 原点 距离 x, =1, 2 和 3. 























图 12. 8 ”二 元 一 阶 模 型 的 响应 曲面 图 12.9 RH x, fü x, 之 间 无 交互 作用 的 图 


定义 12 3 “两 个 变量 x fe x 称 为 有 交互 作用 的 ， AUR xy 变化 1 个 单位 (x 不 变 ) 时 , E(y) 的 
变化 与 x, 的 值 相 关 . 
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二 元 交互 作用 (二 阶 ) 模型 
E(y) =B *Bixi *Byx, + Byx%, 
模型 参数 的 解释 : 
Bo: y 轴 截 距 ; x, = x, =0 BE E(y) 的 值 . 
B, TB: 改变 Bl f Bu, S| EDO RE x, x, 轴 位 移 . 
Bs: 控制 直 纹 曲面 上 的 挠 曲率 ( 见 图 12.10). 
当 一 个 自 变量 保持 不 变 时 ,模型 产生 如 下 斜率 的 直线 : 
Bı *Byxy: 当知 固定 时 ,xi 增加 1 个 单位 时 天 (7y) 的 变化 量 . 
B, tix: 3x, 固定 时 , x, 增加 1 个 单位 时 E(Y) 的 变化 量 . 

















交互 作用 模型 称 为 二 阶 的 , 因为 | 和 xz, 的 最 高 阶 (xizz ) 次 数 是 2; 换言之 ,x TI x, 的 指数 和 等 
于 2 这 个 模型 在 三 维 空间 产生 一 个 直 纹 曲面 ( 见 图 12.10). 将 一 根 铅笔 放 在 垂直 于 一 条 直线 的 地 
方 , 然后 沿 着 这 条 线 移动 铅笔 同时 间 绕 这 条 线 旋转 铅笔 ,得 到 这 个 曲面 ， 即 所 得 的 曲面 呈 挠 曲面 . 对 
给 定 的 x, ff (x, 21, 2, 3) , fE xi KRR, EO) 图 形 产生 不 平行 的 等 高 线 ( 见 图 12. 11) ,这 表明 对 
于 给 定 x 的 变化 , E(y) 的 改变 依赖 于 x, 的 值 , 因此 , xi #U x, 是 相互 影响 的 . 交互 作用 是 一 个 非常 
重要 的 概念 ,因为 习惯 拟 合 一 阶 模型 , 并 且 单 独 地 检查 E(y) 和 自 变量 集合 x, 32, cU. xy 中 每 一 个 
变量 之 间 的 关系 , 这 是 容易 的 . 当 交 互 作用 存在 时 ， 这 样 的 做 法 就 没有 什么 意义 了 (至 少 在 某 种 程度 
t, 几乎 总 是 这 样 ), 并 且 可 能 导致 有 严重 错误 的 解释 . 例如 , 假定 E(y) I x, , x; 之 间 的 关系 如 图 
12.11 所 示 , 对 于 n=9 4 x, 和 xs (x =0, 1,2 8125 21,2, 3) 的 组 合 中 的 每 一 个 , 给 出 y 的 观测 
fH. WRH x, M xc, 的 一 阶 模型 拟 合 数据 ， 拟 合 的 平面 (除了 随机 误差 ) 近 似 地 与 (xi , x; ) 面 平行 , 因 
此 可 以 看 出 x, 和 对 EC) 提供 非常 少 的 信息 . 图 12. 10 表示 的 显然 不 是 这 种 情况 . 用 一 阶 模型 拟 
合 数 据 不 允许 挠 曲 真实 曲面 , 因此 给 出 BCy) 和 zi , x; 之 间 关 系 一 个 不 真实 的 印象 . 发 现 两 个 自 变量 
之 间 交 互 作用 的 过 程 可 以 看 做 检查 模型 ,交互 作用 模型 与 无 交互 作用 一 阶 模型 之 间 的 不 同 仅仅 在 于 
是 否 包 含 Byx1x， 项 ， 


y 














E(y) 
AL X273 
3- x, = 2 
2 x, =1 
一 一 

l | _ | x 


| 
0 0.5 1.0 1.5 2.0 





图 12.10. (二 阶 ) 交 互 作用 模型 的 响应 曲面 图 12.11 表明 % 和 之 间 的 交互 作用 的 图 
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交互 作用 模型 : E(y) 2 Bo t Bixi +B% + Baxixz 
一 阶 模型 : E(y) 2 Bo * ixi * Box; 
因此 , 为 了 检验 交互 作用 是 否 存在 ,我们 检验 
Hy: B3=0 (无 交互 作用 ) 
对 备 择 假 设 
H,:B,70 (有 交互 作用 ) 
用 11.4 节 熟 悉 的 学 生 了 检验 . 





完全 的 二 元 二 阶 模型 
E(y) =Ë, * Bix, +B;x; t Bux, +Bax? Bux, 
模型 参数 的 解释 : 
Bo: y 轴 截 距 ; x, =x, =0 时 五 (y) 的 值 . 
Bi fn B,: 改变 Bi e B,, 使 曲面 沿 着 x shiu x, 轴 位移 . 
By: Bs 的 值 控制 曲面 的 挠 曲 . 
B, # B; : 这 些 参数 的 符号 和 值 控 制 曲面 的 类 型 和 曲率 . 
下 面 三 个 类 型 曲面 可 以 由 二 阶 模型 产生 9 : 
e 开口 向 上 的 抛物 面 (图 12. 12a). 
° 开口 向 下 的 抛物 面 ( 图 12. 12b). 
e° BO d WI. 12c). 











EQ) Ety) 
W xi Xi 
X3 X3 
a) b) 





图 12. 12 ”三 个 二 阶 曲面 图 


完全 二 阶 模型 是 单个 定量 变量 二 阶 模型 的 三 维 等 价 物 . 它 描 绘 的 不 是 抛物 线 ， 而 是 抛物 面 和 鞍 
形 曲 面 . 因为 只 用 完全 曲面 的 一 部 分 拟 合 数据 , 所 以 完全 二 阶 模型 提供 了 多 种 平缓 的 曲面 . 如 果 期 户 
联系 E(y) 与 «1 及 so 响应 曲面 是 弯曲 的 , 这 个 模型 是 个 好 的 选择 ， 

很 多 公司 制造 的 产品 (例如 钢 、 油漆 、 汽油 ) 至 少 部 分 是 用 化 学 方法 产生 的 ,在 很 多 例子 
中 , 成 品 的 质量 是 化 学 反应 发 生 时 的 温度 和 压强 的 函数 . 假定 想 为 产品 的 质量 y 作为 产品 生产 时 的 
温度 x! 和 压强 x, 的 函数 建立 一 个 模型 . 4 个 检查 员 独立 地 给 每 个 产品 的 质量 在 0 ~ 100 之 间 评 分 ， 
质量 y 用 4 个 分 数 的 平均 值 来 计算 . 做 一 个 试验 , 令 温 度 在 80 ~ 100 下 之 间 变 化 , 压强 在 50 ~ 60 lby 
in? 之 间 变 化 ,得 到 的 数据 在 表 12. 2 中 给 出 . 





© Mg >48,Bs 时 产生 鞍 形 曲面 ( 图 12. 2c). 对 于 «48,B, ， 348, +Bs >0 时 抛物 面 开口 向 上 (图 12. 12a) , M B, +B; < 
0 时 抛物 面 开 口 向 下 (图 12. 12b). 
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a. 用 完全 二 阶 模型 拟 合 数据 . 
b. 画 出 响应 曲面 . 
c. 检验 模型 的 整体 效用 . 
表 12.2 温度 、 压 强 和 成 品 的 质量 




















x, CF) x (psi) y x CF) X5 (psi) y x; CF) xz (psi) y 
80 50 50.8 | 90 50 63.4 100 50 46.6 
80 50 50. 7 90 50 61.6 100 50 49.1 
80 50 49.4 90 50 63.4 100 50 46.4 
80 55 93.7 90 55 93.8 100 55 69.8 
80 55 90.9 90 55 92.1 100 55 72.5 
80 55 90.9 90 55 97.4 100 55 73.2 
80 60 74.5 90 60 70.9 100 60 38.7 
80 60 73.0 90 60 68.8 100 60 42.5 
80 60 71.2 90 60 71.3 100 60 41.4 

LI 6 44 _ 
解 


a. 完全 二 阶 模型 是 ， 
E(y) = Bo * Bixi * Box; * Bax ix, Bax] + Bsx2 
用 这 个 模型 拟 合 表 12. 2 中 的 数据 , 图 12. 13 给 出 了 SAS 输出 结果 的 一 部 分 . 











Dependent Variable: QUALITY 
ñnalysis of Variance 
Sum of Mean 加 
Source DF Squares Square F Value Pr >F 
Model 5 8402.26454 1680.45231 556.35 — «0001 
Error 21 59.17843 2.81802 
Corrected Total 26 8461 .44296 
Root MSE 1.67870 — H-Buuere 0.9990 
Dependent Mean 56.936296 fidj R-Sq 0.3913 
Coeff Var 2.50590 
Parameter Estimates 
Paraneter Standard 
Var iable DF Estimate Error t Value Pr > itl 
Intercept 1 -5127.89907 110.29601 -46.49 <.0001 
TEMP 1 31.09639 1.34441 23.13 «.0001 
PRESSURE 1 139.74722 3.14005 44.50 <. 0001 
TEMPRESS I -0.14550 0.00969 -15.01 €.0001 
TEMPSQ 1 -0.13339 0.00585 -19.46 <.0001 
PRESSQ 1 -1.14422 0.02741 -41.74 <.0001 





图 12. 13 完全 二 阶 模型 的 SAS 输出 
最 小 二 乘 预 测 方程 是 : 
Y= -5127. 90 +31. 10x, + 139. T5x> -0. 146%1 x, -0. 133a? — 1. 1452 
b. 图 12. 14 给 出 这 个 预测 模型 的 三 维 图 . 注意 到 在 温度 大 约 为 85 ~ 90 下 ， 压强 大 约 为 55 ~ 
57 lb/in? 时 , 平均 质量 达到 最 高 G. 在 这 个 范围 内 的 进一步 试验 可 能 会 得 到 一 个 更 精确 的 最 优 温度 - 





O RETES x =0 Maan -0 fifü x, 和 x ,使 最 小 二 乘 模型 中 的 质量 达到 最 大 的 温度 和 压强 值 . xdi 
计 的 最 优 值 是 x — 86. 25 FA x, —55. 58 lb/in?. 
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压强 组 合 . 








图 12.14 例 12.3 的 二 阶 最 小 二 乘 模型 图 


“考虑 决定 系数 尼 =0. 993 ,检验 整个 模型 的 下 值 , F =596.32, 检验 的 p 值 ， p =0. 0001 (fe Fi] 
12. 13 中 ) ， 毫 无 疑问 ， 这 个 完全 二 阶 模型 对 解释 平均 质量 作为 温度 和 压强 的 函数 是 有 用 的 . 当然 ， 
并 不 总 是 这 种 情况 ,二 阶 模型 的 额外 复杂 性 只 有 在 得 到 了 一 个 好 模型 时 才 有 价值 . 因此 , 决定 模型 中 
的 高 阶 (例如 曲线 项 64 和 Bs ) 项 在 统计 上 是 否 有 用 是 很 重要 的 . 对 假设 Ho: B, = Bs =0 的 检验 在 


12. 8 节 中 给 出 . 
应 用 练习 
12.16 和 画 一 阶 模型 图 . BE EO) 和 定量 自 变量 x 

FI x, 之 间 的 关系 由 下 面 的 一 阶 模型 给 出 : 

E(y) =4 - x, 42x, 

a. 描述 对 应 的 响应 曲面 . 

b. MH x, =2、3、4, Os x,= 5 时 , 响应 曲面 的 等 高 线 . 

c. MH x =2、3、4, 0 x, = 5 时 , 响应 曲面 的 等 高 线 . 
- 利用 b 和 c 中 所 画 的 等 高 线 说 明 x, 和 x 设置 的 

改变 是 如 何 影响 五 (y) 的 ? 

e. 利用 b 中 的 图 确定 当 x, 从 4 变 成 2, H x, 同时 

从 1 变 成 2 时 , EF(y) 有 多 少 的 改变 ? 

12.17 务 二 阶 模型 图 . 假设 ECy) 和 定量 自 变量 x, 

TI x, 之 间 的 真实 关系 是 : 

E(y) 24-5, +2x, 4 xx, 

回答 练习 12. 16 中 的 问题 ,解释 交互 作用 项 对 平均 

响应 ECy) 的 影响 . . 
12.18 有 机 蒸汽 的 吸附 . 参考 练习 12.5, Environ- 

mental Science & Technology 中 关于 有 ILZE AUR ER ME 

用 的 研究 . 考虑 保持 系数 y 作为 如 下 两 个 自 变量 : 

x, = 温度 ( 度 ) 


e 


x, = 相对 湿度 ( 百分率) 
的 函数 模型 . 
a. 写 出 E(Y) 的 一 阶 模型 . 
b. 写 出 E(y) 的 完全 二 阶 模型 . 
eX E(y) S —^ ES, 假设 : (i) 线性 关系 ; 
(ji) 保持 系数 (y) 和 温度 (2 ) 之 间 的 关系 依赖 于 
相对 湿度 (xz ) . 


12.19 为 鳗鱼 的 速度 建 模 . 一 位 哈佛 大 学 的 生物 学 


家 用 多 元 回归 作为 美国 鳗鱼 的 游 速 模型 ，( Proceed- 

ings of the Royal Society, B, 2004 年 12 H ) 构造 模 

型 , 使 稳定 的 游 速 y( 身长 每 秒 ) 作 为 定量 变量 身体 

UE x, (身长 每 秒 ), 尾部 振幅 离 差 (身长 ) 和 尾 

部 速度 离 差 x, (身长 每 秒 ) 的 函数 . 

a. 写 出 天 (7Y) 作 为 三 个 自 变量 函数 的 一 阶 模型 . 

b. 解释 a 中 模型 里 的 g, 值 . 

c. 假设 身体 波 速 x, 和 尾部 振幅 离 差 x, 之 间 有 交互 
TERI, 写 出 E(y) 作 为 三 个 自 变量 函数 的 模型 . 

d. 根据 c 中 模型 里 的 各 B 项 , 对 固定 的 Me, 尾部 
速度 离 差 x, 每 增加 一 个 单位 时 E(y) 如 何 变 化 ? 

e. 根据 c 中 模型 里 的 各 有 项 , 对 固定 的 x, 和 x,, 尾部 
振幅 离 差 x, 每 增加 一 个 单位 时 E(y) 如 何 变 化 ? 
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12.20 半导体 唱片 厚度 . 在 Journal of the American 

Statistical Association ( 1998 年 3 月 ) 中 分 析 了 利用 

快速 热 化 学 真空 镀膜 加 工 半 导体 晶片 的 多 晶 硅 厚 

度数 据 , 下 面 的 表 给 出 了 在 某 地 加 工 的 22 个 晶片 

多 晶 硅 厚度 测量 值 ( 埃 ) 以 及 用 于 晶片 的 氧化 物 厚 

BE GR) 和 镀膜 时 间 (s). 

a. 对 多 唱 硅 厚度 (y) 作 为 氧化 物 厚度 (” ) 和 镀膜 时 
[E] (c, ) 的 函数 写 出 一 个 完全 二 阶 模型 . 

b. 用 模型 拟 合 数据 , 给 出 最 小 二 乘 预测 方程 . 

c. 检验 模型 里 的 二 次 项 是 否 必要 . 用 a = 0.05 

检验 . 

检验 氧化 物 厚 度 (%, ) 和 镀膜 时 间 (x, ) 之 间 是 否 

有 交互 作用 ,用 a =0. 05 检验 . 

e. 根据 c 和 4d 的 结果 , 请 推荐 对 模型 做 什么 样 的 修 
IE? 并 给 出 解释 . 


= 





氧化 物 厚度 时 间 多 唱 硅 厚度 
(x1, 埃 ) (35, s) (y, 埃 ) 
1 059 18 494 
1 049 35 853 
1 039 52 1 090 
1 026 52 1 058 
1 001 18 517 
986 35 882 
1 447 35 732 
458 35 1 143 
1 263 23 608 
1 283 23 590 
1 301 47 940 
1 287 47 920 
1 300 47 917 
1 307 23 581 
632 23 738 
621 23 732 
623 23 750 
620 47 1 205 
613 47 1 194 
615 47 1221 
478 35 1 209 
1 498 35 708 


———————M——————————À9Á9$ PL 
资料 来 源 : Hughes-Oliver, J., Lu, J., and Gyuresik, R. 


“Achieving uniformity in a semiconductor fabrication process 
using spatial modeling. " Journal of the American Statistical As- 
sociation, Vol. 93. March 1998. 





12.21 地 震波 研究 . 一 位 勘探 地 震 学 家 开发 一 个 估 


计 地 震波 的 平均 信 品 比 y,， 作为 下 面 两 个 自 变量 函 
数 的 模型 ; 

x, = 频率 (每 秒 的 周期 数 ) 

x, = 小 波 振幅 

a. 判断 自 变量 是 定量 的 还 是 定性 的 . 

b. 写 出 E(y) 的 一 阶 模型 . 

e. 为 E(y) 写 出 一 个 包含 所 有 一 阶 项 和 交互 作用 项 
的 模型 . 对 x, 的 不 同 取 值 , 画 出 平均 信 噪 比 
E(Y) 关 于 小 波 振 幅 x, 的 典型 响应 曲线 . (假设 
x, 和 x%, 有 交互 作用 . ) 

d. 写 出 E(y) 的 完全 二 阶 模型 . 


12. 22 语言 识别 器 . Human Factors (1990 年 4 月 ) 


刊载 了 一 项 研究 识别 器 的 准确 度 和 词汇 量 对 一 台 
计算 机 化 语言 识别 器 性 能 的 影响 . 机 器 的 准确 度 
(x, ) 用 正确 地 识别 口语 表达 的 百分比 来 度量 , W 
置 为 三 个 水 平 :90% , 95% 和 99%. 词汇 量 (x, ) FH 
任务 所 需要 的 单词 百分比 来 度量 , 也 设置 为 三 个 
水 平 : 75% , 87. 5% 和 100%. 最 感 兴趣 的 因 变 量 是 
任务 完成 时 间 (y, min) ,从 语言 识别 器 的 使 用 者 说 
第 一 句 话 开始 度量 , 一 直到 识别 器 显示 任务 的 最 
后 一 个 单词 为 止 . 收集 的 n=162 个 试验 数据 用 于 
任务 完成 时 间 y 作为 定量 自 变 量 准确 度 (x, ) 和 词 
TL (x, ) 的 函数 拟 合 一 个 完全 二 阶 模型 ,模型 的 决 
EUER =0.75. 

a. Sil E( y) 的 完全 二 阶 模型 . 

b. fg £t R^ fii. 

c. 检验 整个 模型 的 恰当 性 , 取 a =0. 05. 


12.23 药片 配方 研究 . 阿 普 强 公司 的 研究 员 将 多 元 


回归 分 析 运 用 到 持续 一 释放 药片 的 开发 中 2. 其 中 

一 个 研究 目标 是 提出 联系 药片 融 解 量 y( 即 一 个 指 

定时 期 药片 溶解 的 百分比 ) 和 下 面 自 变量 的 模型 . 

x, = 赋 形 剂 水 平 ( 即 药片 中 非 药 成 分 量 ). 

x, = 工艺 变量 ( 即 制作 药片 时 的 机 器 设置 ). 

a. 写 出 E(y) 的 完全 二 阶 模型 . 

b. 假设 E(Cy) 5j x, 和 %, 之 间 具 有 线性 关系 ， 目 x, 
TI x, 之 间 没 有 交互 作用 , 写 出 模型 . 

c. 在 模型 中 添加 交互 作用 项 , 重复 b 部 分 . 

d. 对 于 c 中 模型 ,对 固定 的 x,, ECy) RI x, 之 间 线 


O 资料 来 源 : Klassen, R. A. "The Application of Response Surface Methods to a Tablet Formulation Problem" 文章 发 表 在 Joint 
Statistical Meetings, American Statistical Association and Biometric Society, Aug. 1986, Chicago, IL. 
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性 关系 的 斜率 是 多 少 ? 个 类 星体 的 数据 在 下 表 中 给 出 . ) 
e. 对 于 c 中 模型 , 对 固定 的 x， E(y) fli x, 之 间 线 a. 写 出 y 作为 红 移 (x )， 线 电 通 量 (x,) 和 AB... 
性 关系 的 斜率 是 多 少 ? (x, ) 的 函数 的 完全 二 阶 模型 . 
12.24 类 星体 的 外 层 空 间 调查 . 参考 练习 11.24, b. 利用 统计 软件 包 , 用 a 中 模型 拟 合 数据 ,全 模型 
The Astronomical Journal ( 1995 年 7 月 ) 提出 在 一 次 对 预测 y 统计 有 用 吗 ? 
外 层 空 间 调查 中 发 现 的 类 星体 . 回想 用 于 类 星体 特 c. 检验 模型 中 的 任意 曲线 项 对 于 y 的 预测 是 否 统 
征 的 静止 框架 等 价 宽度 (7) 模型 的 几 个 定量 自 变 计 有 用 ? 


1,25 个 类 星体 的 数据 存在 文件 QUASAR rh. (前 5 
类 星体 红 移 (xi ) 线 电 通 量 (x,) RHE) ABlaso (14) ”绝对 星 等 (xs ) 静止 框架 等 效 宽 度 (y) 





1 2.81 -13.48 45. 29 19. 50 -26.27 117 
2 3.07 -13.73 45. 13 19. 65 - 26.26 82 
3 3.45 ` -13.87 45. 11 18. 93 -27.17 33 
4 3.19 -13.27 45. 63 18. 59 -27.39 92 
5 3.07 -13. 56 45. 30 19. 59 - 26. 32 114 


资料 来 源 : Schmidt M. , Schneider, D. P. , and Gunn J. E. “ Spectroscopic CCD surveys for quasars at large redshift” The Astronomical 
Journal, Vol.110, No.1, July 1995, p.70( 1 ). 


2.5 编码 定量 自 变 量 


在 拟 合 高 阶 多 项 式 回 归 模 型 (例如 二 阶 或 者 三 阶 模型 ) 时 ,为 定量 自 变量 编码 通常 是 一 个 好 方 
法 . 例如 , 假定 回归 分 析 中 有 一 个 自 变量 是 温度 T, 在 三 种 水 平 : 50 下 , 100 °F I 1507F LIRIM T. 可 以 
用 下 面 的 公式 编码 (或 者 变换 ) 温度 ， 
_ T -100 


x= 


50 

那么 ， 编码 水 平 x = -1,0,1 相应 于 原水 平 50 °F, 100 FFI 150 °F. 

在 一 般 意 义 上 , 编码 意味 着 把 一 个 自 变量 集 (定性 或 者 定量 ) 变换 为 一 个 新 的 自 变量 集 . 例如 ， 
如 果 我 们 观测 两 个 自 变 量 ( 了 = 温度 , P= 压强 ) 那 么 可 以 将 这 两 个 自 变量 T 和 P 变换 成 两 个 新 的 编 
码 变 量 X1 和 X» ,其 中 x] #l X5 通过 下 面 两 个 函数 式 与 THP 相 联 系 : 

x =f (T, P) x,=f,(T, P) 

BEA f f, 是 建立 了 和 P 水 平 组 合 与 41 和 的 编码 值 组 合 之 间 一 一 对 应 的 代数 关系 . 

因为 定性 自 变 量 是 非 数值 的 , 有 必要 将 它们 的 值 进行 编码 来 拟 合 回归 模型 . 但 是 ， 可 能 会 问 为 
什么 要 为 定量 自 变量 编码 . 为 定量 变量 编码 有 两 个 相关 的 原因 . 首先 ， 计算 机 似乎 并 不 在 意 回归 分 析 
中 自 变量 的 可 能 取 值 , 但 情形 并 不 是 这 样 . 回想 11.3 节 ， VESEBLAADSERS Pe CX" X) s it e f 28] s mol 
参数 的 最 小 二 乘 估计 . 在 求 逆 过 程 中 , 0032281680 X) 的 数 在 绝对 值 上 变化 很 大 , 可 能 产生 相当 大 的 
舍 人 误差 . 这 可 能 导致 最 小 二 乘 估 计 所 , B, a, … 的 计算 值 产生 相当 大 的 误差 , 编码 使 计算 矩阵 
(X'X)} 的 逆 在 计算 上 比较 容易 ， 因 此 得 到 更 精确 的 估计 . 

为 定量 变量 编码 的 第 二 个 原因 是 11. 11 节 中 讨论 的 多 元 共 线 性 . 当 用 多 项 式 回 归 模 型 (例如 二 阶 
RE), 特别 是 拟 合 高 阶 项 时 ,多 元 共 线性 问题 是 不 可 避免 的 . 例如 ， 考虑 二 次 模型 ; 

E(y) 2 fg *tBix +B, 
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AUR x 值 的 变化 范围 比较 小 , 那么 两 个 变量 x, = x 和 x, =x? 将 高 度 相关 . 正如 我 们 在 11.11 节 中 指 
出 的 , 当 存 在 多 重 共 线 性 时 ,回归 系数 舍 和 误差 的 可 能 性 会 增加 . 





解决 会 人 误差 问题 的 最 好 方法 是 : 
L 给 定量 变量 编码 , 使 得 新 的 编码 原点 是 编码 值 的 中 心 . 例如 , 温度 了 编码 为 ; 
, 1-100 
- 50 


我 们 得 到 编码 值 -1, 0，1 ,这 就 将 编码 原点 0 放 在 编码 值 范围 ( -1, 1) 的 中 点 . 

2 对 定量 变量 编码 使 得 编码 值 范围 对 所 有 编码 变量 是 大 致 相同 的 . 不 必 严 格 地 坚持 这 个 要 求 . 
一 个 自 变 量 的 取 值 范围 可 以 是 另外 一 个 变量 范围 的 2 倍 或 者 3 i, 不 会 产生 任何 困难 ,但 是 如 果 这 些 
范围 有 相当 大 的 悬殊 , 例如 , 100 比 1 的 比例 , 则 是 不 合 要 求 的 . 

当 数 据 是 观测 的 ( 自 变量 的 可 能 取 值 不 被 控制 ) 时 ， 下 面 框 格 中 描述 的 编码 过 程 合理 地 满足 这 两 
个 要 求 . 编码 变量 与 5.5 节 中 的 标准 化 正 态 = 统计 量 相似 ,因此 , u 值 是 以 s, 为 单位 表示 的 x 和 x 
的 均值 x 之 间 的 离 差 9. 因为 我 们 知道 集合 中 的 大 多 数 (大 致 95% ) 测 量 值 位 于 它们 均值 的 2 个 标准 
ELAN, 因此 多 数 编码 值 位 于 -2~2 的 区 间 内 . 

观测 数据 的 编码 步骤 
令 x*= 未 编码 的 定量 自 变量 , u = 编码 的 定量 自 变量 ， 如 果 对 于 回归 分 析 中 的 忆 个 数据 点 ,x 取 值 为 x， 


X), > Öns x 





x 





其 中 s, 是 x 值 的 标准 差 ， 即 














如 果 把 这 种 编码 用 到 每 个 定量 变量 , 每 个 值 的 范围 将 大 概 在 -2 ~2 之 间 ,系数 矩阵 中 元 素 绝对 
值 的 变异 是 适度 的 , 在 求 和 矩阵 的 逆 时 含 人 误差 将 减 小 . 另外 , xm 22 之 间 的 相关 性 将 降低 S. 
昆虫 学 家 常用 二 氧化 碳 引 诱捕 捉 器 来 监视 蚊子 总 体 ， Journal of the American Mosquito Con- 
trol Association (1995 4E 3 月 ) 中 一 篇 文章 研究 了 温度 是 否 影响 捕捉 器 能 捕捉 到 的 蚊子 数量 . 连续 9 天 
中 的 每 天 采集 9 个 蚊子 样本 ,每 天 测量 两 个 变量 ; x = 平均 温度 (摄氏 度 ) , y = 捕 蚊 率 (每 个 样本 中 的 
捕 提 米子 数 除 以 最 大 的 样本 捕捉 蚊子 数 ) , 表 12.3 给 出 了 数据 . 

研究 者 感 兴趣 的 是 捕 所 率 y 和 平均 温度 * 之 间 的 关系 . 假定 考虑 使 用 二 次 模型 . 

a. 对 观测 数据 利用 编码 系统 给 出 联系 编码 变量 u 与 温度 x 的 式 子 . 





O Bis 的 除数 不 必 精准 地 等 于 s。， 任何 近似 等 于 ,的 数 都 满足 要 求 . 其 他 候选 的 分 母 是 极 差 4 和 四 分 位 数 间距 
(IQR). . 

O 编码 的 另 一 个 副 产 物 是 模型 的 B 系数 有 些微 不 同 的 解释 . 例如 ， 在 模型 E(y) =p +Biu H, 这 里 w= (x -10)75,x 每 
增加 1 单位 , y 的 变化 不 是 B1, 而 是 B1/5. 一 般 地 ， 对 于 编码 定量 自 变量 的 一 阶 模型 , 5 x; 关联 的 斜率 表示 pB;/s。 ,这 
里 ss 是 编码 x; 的 除数 . 
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b. 计算 9 个 % 值 的 编码 值 . 
e. R n =9 ^f u RA. 
3812.3 fj 12.4 的 数据 











数 5 平均 温度 ,x 捕 蚊 率 ,y 数 dg. 平均 温度 ,x 捕 蚊 率 ,7 
7 月 24 16.8 0.66 7 H 29 22.6 0. 99 
25 15.0 0.30 30 23.3 0.75 
26 16.5 0.46 31 18.2 0.24 
27 17.7 0.44 8H1 18.6 0.51 
28 20.6 0.67 
资料 来 源 : Petric. D. , et.al., * Dependence of CO, -baited suction trap captures on temperature variations. " Journal of the American 
Mosquito Control Association, Vol. 11, No. 1 ; Mar. 1995, p.8. 
解 


a. 我 们 首先 求 x Ms, 图 12. 15 的 MINITAB 的 输出 , 提供 了 温度 % 的 概括 统计 量 , 得 到 
x =18.811 s, =2. 812 
那么 , KA u H x BUS REA 


_x -18.8 
2.8 
b. 当 温度 x = 16.8 BF, 
,2-18.8 168-188 _ 


2.8 2.8 = -0.71 





AUR, H x = 15.0 时 ， 
.x-18.8 15.0-18.8 
| 28 28 


d 12.4 给 出 了 所 有 9 个 观测 值 的 编码 值 . ( 注 : 可 以 看 到 9 个 4 值 都 位 于 区 间 -2 -2 之 间 . ) 
c. 如果 忽略 伟人 误差 , 9 A u 值 的 和 将 是 0. 这 是 因为 测量 值 集 合 关于 它们 均值 的 离 差 之 和 总 是 





u = - 1.36 





0. 
Variable N Mean Median TrMean StDev SE Mean 
x 9 18.811 18.200 18.811 2.812 0.937 
Variable Minimum Maximum Ql 03 
x 15.000 23.300 16.650 21.600 





图 12.15 温度 % 的 MNITAB 描述 性 统计 量 
表 12.4 12.4 中 x 的 编码 值 
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为 了 说 明 编 码 的 优点 , 考虑 用 二 阶 模型 
E(y) 7 Bo * Bix * Bx? 
拟 合 例 12.4 的 数据 . AAEE xL 之 间 的 相关 系数 在 图 12. 16. MINITAB 输出 的 顶部 给 出 r = 
0. 998. 然而 图 12. 16 底部 给 出 相应 编码 值 x M u 之 间 的 相关 系数 只 有 r = 0.448. 因此 , 我 们 拟 合 
模型 
E(y) =Bo *Brusgzw 
可 以 避免 由 于 高 度 相 关 的 x 值 引起 潜在 的 舍 和 误差. 





Correlations: X, XSQ 


Pearson correlation of X and XSQ = 0.998 
P-Yalue - 0.000 


Correlations: U, USQ 


Pearson correlation of U and USQ - 0.448 
P-Value = 0.227 











E 12.16 温度 x 和 编码 温度 xz 的 MINITAB 相关 性 


用 来 减 小 舍 人 误差 和 多 重 共 线 性 的 其 他 编码 方法 也 已 经 提出 . 一 个 比较 复杂 的 编码 系统 牵涉 到 
拟 合 正 交 多 项 式 ,编码 的 正 交 系统 保证 编码 自 变量 是 不 相关 的 ,对 于 正 交 多 项 式 的 讨论 参考 本 章 末 给 
出 的 文献 . 























12.25 带 激 光 的 太阳 能 照明 . 参 靠 练习 11. 57，Jour- c. 计算 变量 x* RI” 之 间 的 相关 系数 7. 
激光 器 的 太阳 能 照明 的 研究 ,这 里 再 次 给 出 分 析 的 与 e 中 计算 的 值 . 
数据 . e. 利用 可 得 到 的 统计 软件 拟 合 模型 : 
Wh 波导 AI | miem — 波导 AI E(y) -By * Bue Bof 
y(A/cm?) x( 摩 尔 分 数 ) y(AZem2) x( 摩 尔 分 数 ) 并 解释 结果 . 

273 0.15 162 0.35 12.26 轮胎 压力 和 行车 里 程 . 假定 想 利用 观测 数据 

175 0.20 165 0.40 的 编码 系统 , 用 一 个 二 阶 模型 拟 合 下 表 给 出 的 轮 

146 0.25 245 0.50 胎 压 力 -汽车 行车 里 程 数 据 . 

166 0. 30 314 0. 60 压力 % 行程 7 压力 x 行程 7 
资料 来 源 ; Unnikrishnan, S. , and Anderson, N. G. “ Quan- (Ib/in? ) ( kmile) (Ib/in? ) ( kmile) 
tum-well lasers for direct solar photopumping. " Journal of Ap- 30 29.5 33 37.6 
plied Physics, Vol. 74 , No. 6, Sept. 15, 1993, p. 4226 (由 图 " > : " x 7 
2 改编 ). 31 34.5 35 33.6 
a. 给 出 编码 变量 w 和 波导 之 间 的 关系 式 , 对 观测 > 0 | - 





数据 用 编码 系统 . 


38. 2 27.4 
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a. 利用 观测 数据 的 编码 系统 给 出 编码 变量 w 和 压 合 模型 ， 
力 x 之 间 的 关系 式 . E(y) =B, +Biu * B 
b. 计算 编码 值 u. 并 解释 结果 . 


c. 计算 变量 x a^ 之 间 的 相关 系数 r 12.28 液体 的 光 密度 . 在 练习 11.5 中 已 经 提出 过 ， 











d. 计算 变量 w 和 w 之 间 的 相关 系数 7, 比较 这 个 值 Applied Spectroscopy 中 关于 超 聚 超 氟 丙 烯 氧 化 物 红 
与 c 中 的 计算 值 . 外 线 反射 率 范围 的 研究 , 下 表 重 新 给 出 分 析 的 
e. 利用 可 得 到 的 统计 软件 拟 合 模型 数据 . 
E(y) =B, +Biu + Bw? 光 密 度 y 波段 频率 xi (cm-!) 胶片 厚度 x, (mg) 
并 解释 结果 . 0.231 740 1.1 
12.27 行走 研究 . 参见 练习 11. 36, American Scientist 0.107 740 0.62 
(1998 年 7 月 至 8 H), 研究 了 自 回 避 行 走 和 无 根 0.053 740 0.31 
行走 的 个 数 之 间 的 关系 , 附 表 给 出 了 用 于 分 析 的 0. 129 805 1.1 
数据 . 0. 069 805 0.62 
i —àÜüà 0. 030 805 0.31 
行走 长 度 ( 步 数 ) 1. 005 980 1.1 
无 R B 回避 
0. 559 980 0.62 
l 1 4 0. 321 980 0.31 
2 2 12 2. 948 1235 1.1 
3 4 36 1. 633 1235 0. 62 
4 9 100 0. 934 1235 0.31 
5 22 284 资料 来 源 : Pacansky, J. , England, C. D, and Waltman, 
6 56 780 R. " Infrared spectroscopic studies of poly ( perfluoropropyle- 
neoxide) on gold substrates; A classical dispersion analysis for 
7 147 2172 the refractive index. ” Applied Spectroscopy, Vol. 40, No. 1, 
8 388 5916 Jan. 1986, p.9 (32 1). 


资料 来 源 ， Hayes, B. “How to avoid yourself. " American Sci- 
entist, Vol. 86, No. 4, Jul-Aug, 1998 (图 5). 


a. 利用 观测 数据 的 编码 系统 给 出 编码 变量 u 和 行 


假定 利用 本 节 给 出 的 编码 系统 拟 合 完全 二 阶 模型 
E(y) =B; *Bixi t Box, + Bax x, +B, +B; 
a. 分 别 给 出 xi 和 x; 的 编码 值 u, 和 Uu. 


EKE r 之 间 的 关系 . 
. ARH u. 
. 计算 变量 x 和 ww 之 间 的 相关 系数 r~ 
计算 变量 w 和 ww 之 间 的 相关 系数 7, 比 较 这 个 值 
与 c 中 计算 的 值 . 


° m= 


= 


b. 比较 x, 和 %% 之 间 的 相关 系数 与 wu M u? 之 间 的 
相关 系数 . 

c. 比较 x, FIL x; 之 间 的 相关 系数 与 w, 和 好 之 间 的 
相关 系数 . 

d. 用 编码 值 u, 和 u, 拟 合 完全 二 阶 模型 , 解释 


e 令 y= 无 根 行走 的 次 数 , 用 可 得 到 的 统计 软件 拟 结果 . 
12.6 一 元 定性 自 变量 模型 


假定 希望 描写 一 个 内 燃 机 发 动机 的 平均 性 能 E(y) 作为 燃料 类 型 的 函数 模型 , (为 了 便于 解释 ， 
忽略 其 他 可 能 影响 响应 的 自 变 量 . ) 进 一 步 ， 假定 有 三 种 可 用 的 燃料 类 型 ; 石油 燃料 (P) 、 煤 燃 料 (C) 
和 混合 燃料 (B). 燃料 类 型 是 相应 于 燃料 P、C 和 三 个 水 平 的 定性 变量 . 注意 对 一 个 定性 自 变量 ， 
不 能 对 给 定 的 水 平 附 加 一 个 定量 意义 ， 我 们 能 做 的 是 描述 它 . 

为 了 简化 记号 , 令 up 是 燃料 P 的 平均 性 能 ， FES uc 和 js 是 相应 燃料 C A B 的 平均 性 能 ,我 
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们 的 目的 是 写 一 个 给 出 三 种 燃料 类 型 均值 y 的 简单 预测 方程 . 这 可 以 如 下 进行 ， 
E(y) =Bo +Bixi * Bax; 
其 中 


1 三 


1, 如 果 使 用 燃料 P。 TL, 如 果 使 用 燃料 C 
lo. 如 果 不 是 lo 如 果 不 是 
表 12. 5 给 出 了 三 种 燃料 类 型 中 每 一 种 的 X1 和 表 12.5 三 种 内 燃 机 燃料 类 型 模型 的 平均 响应 


x, 值 . 





燃料 类 型 xi x 平均 响应 E( y) 
B Bis 不 是 如 定量 自 变量 模型 情况 那 CI s n Pe 
样 有 意义 的 自 变量 ,它们 是 构成 模型 函数 的 虚拟 EMP) 0 hibou 
o *tPi-Hp 
( 示 性 ) S E. 为 了 看 它们 是 如 何 起 作用 的 , 4 
煤 (C) 0 1 Bo * B) - uc 


x; 20, x, =0, 当 我 们 想 得 燃 料 B( 不 是 用 燃料 P 
也 不 是 用 燃料 C; 因此 , 它 必须 是 B) 的 平均 响应 
时 , 应 用 这 个 条 件 . 那么 , 当 使 用 燃料 B 时 , y 的 均值 是 
Ag = E(y) =Bo * (0) +B,(0) 2, 
这 说 明 燃 料 B 的 平均 性 能 水 平 是 Bu. 或 者 , 这 表明 Bo =n. 
现在 假定 我 们 想 表示 使 用 燃料 P 时 的 平均 响应 E(y). 根据 虚拟 变量 的 定义 , 应 该 令 x;-lH 
X, -0: 
Ap 7 E(y) 2 Bo * By (1) +B,(0) =ñ, +B, 
或 者 ， 因为 Bo =HAp， 
Hp =HB * B 
那么 , B; 的 解释 是 
Bi =up -ug 
B, 是 燃料 P 和 B 平 均 性 能 水 平 的 差 . 
最 后 , 如 果 想 得 到 使 用 燃料 C 时 y 的 均值 , 令 xj 20, x, =1: 
Ac = E(y) 2Bo *B1(0) +B,(1) =B +B, 
或 者 , 因为 Bo us, 
Mc =u +B 
那么 , B, 的 解释 是 
B; =uc -upg 
注意 到 仅 用 两 个 虚拟 变量 就 能 够 描述 定性 变量 的 
三 个 水 平 , 因为 基础 水 平 的 均值 (在 本 例 中 是 燃 
料 B) HEB Bo 来 表述 . 22 
因为 燃料 类 型 是 一 个 定性 变量 , 我 们 用 条 形 = 
图 表示 燃料 类 型 三 个 水 平平 均 性 能 E( y) 的 值 ( 见 
图 12.17). 特别 对 每 一 种 燃料 类 型 水 平 条 形 的 高 
BE E(y) 等 于 前 面 等 式 中 给 出 的 模型 参数 之 和 ,可 tno wnas PAD 
以 看 到 对 应 于 燃料 B 的 条 形 高 度 为 Bo; BH E(y) i 
-Bo. 类 似 地 , 对 应 于 P 和 C 的 条 形 高 度 分 别 为 ”图 12.17 比较 三 种 内 燃 机 燃料 类 型 EC) 的 条 形 图 


E(y) 


Bo 
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E(y) =Bo +B) 和 E(y) =Bo +B, Š. 

现在 , 仔细 检查 有 三 个 水 平 的 单个 定性 自 变 量 模型 ,因为 对 于 任意 多 个 水 平 , 我 们 都 用 完全 相 
同 的 模式 . 任意 选择 一 个 水 平 作为 基准 ( 即 虚 拟 变量 全 部 赋值 为 0 的 水 平 ). 然后 为 其 他 水 平 设置 
0 -1 虚拟 变量 9. 这 样 的 方案 总 可 得 出 下 面 框 格 给 出 的 参数 解释 . 


























描写 K 水 平 (4，B，C，D, …) 的 一 元 定性 变量 模型 步骤 
E(y) =Po * Bixi +B,x, t +B, iX.) 
其 中 ， 
Th 如 果 定性 变量 取水 平 i+1 
0, WATE 
CAUEREBSRESTAGUERSIAOHLRA S 如 果 假 定 基 准 水 平 为 A, 则 每 个 水 平 的 均值 是 : 
He 7 Bo * i 
Mc 7 Bo + B; 
Ho =Bo * Bi 
有 的 解释 是 : 
Bo =HA 
Bi =u 一 HA 
B, =c - Ba 
Bs =u 一 HA 
一 家 大 型 咨询 公司 将 一 种 监视 建 路 工 表 12. 6 年 维护 费用 
程 投 标的 电脑 系统 销售 给 各 州 运输 部 门 . 因为 维 m m m 
持 这 个 系统 的 巨大 花费 要 由 公司 承担 一 部 分 , 因 1: EBERIN 2, 肯塔基 州 3: SECUN 
此 公司 比较 三 个 不 同 州 : 堪萨斯 州 、 肯 塔 基 州 和 本 
德 克 萨 斯 州 的 系统 用 户 全 年 平均 维护 费用 . 从 每 126 314 693 
个 州 设置 收集 10 个 用 户 的 样本 , 记录 每 个 用 户 的 MA h » 
维护 费用 , 如 表 12.6 所 示 . 286 585 178 
a 这些 数 据 是 否 提出 了 充分 的 证 据 (a = 105 " 308 
0.05) 表 明 系 统 用 户 产 生 的 平均 全 年 维护 216 185 430 
费 在 三 个 州 是 不 同 的 . 203 354 515 
b. 求 出 并 解释 德 克 萨 斯 州 和 堪萨斯 州 的 平 总 和 (美元 2796 359 478 
均 费 用 之 差 的 95% 置信 区 间 . 





O Bi 或 B 或 两 者 可 以 取 负 值 . 例如 , 如果 B 是 负 的 , 相应 于 燃料 P 的 条 形 高 度 将 从 的 料 B 的 条 形 高 度 降低 ( 而 不 是 增 
高 )B1. 图 12. 17 是 在 假定 B, FL B, 为 正 时 画 出 的 . 

@， 对 虚拟 变量 不 是 必须 用 1-0 编码 系统 . 任何 两 值 系统 都 可 以 很 好 工作 , 但 是 对 模型 参数 的 解释 依赖 于 编码 . 用 1-0 系统 
使 模型 参数 易于 解释 . | 
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解 
a. 联系 E(y) 和 单个 定性 变量 州 设置 的 模型 是 ， 
E(y) =Bo * Bixi * Box; 


其 中 
_ /1 如 果 是 肯塔基 几 
"={ 如 果 不 是 
Ol 如 果 是 德 克 萨 斯 州 
^: 7 [o 如 果 不 是 
并 且 
Bi =u -Hi 
B> =us -HI 


其 中 ji ,pz us 分 别 是 堪萨斯 州 、 肯塔基 州 和 德 克 萨 斯 州 的 平均 响应 ， 检验 三 个 州 平 均值 相等 的 
原 假设 , BI us =j =u 等 价 于 检验 : 
Ho : B, - B, =0 
因为 如 果 B, =u, -u 20 JFH. B; =m -Ai =0, 那么 Ai» Ha 和 js 必须 相等 . 备 择 假设 是 ， 
H. : 至 少 有 一 个 参数 p, zk B, 不 等 于 0 
我 们 用 三 检验 来 检验 完全 模型 (11.5 T), 就 是 检验 模型 中 除了 Bo 以 外 的 参数 全 都 为 0 的 原 假 
设 . 拟 合 完全 模型 


E(y) =Bo +Biz) * Bx, 
的 SPSS 输出 由 图 12. 18 给 出 . 检验 完全 模型 尺 统 计量 值 ( 图 12. 18 中 阴影 部 分 ) 为 =3. 482; 检验 的 
了 值 (也 是 阴影 部 分 ) 为 p=0.045. 因为 选择 的 a = 0. 05 超过 了 p 值 ， 所 以 拒绝 原 假 设 , 并 断定 至 少 有 


Model Summary 














Adjusted Std. Error of 
R Square R Square | the Estimate 
|  4563»| ^^ 205 | 146] 158948 


a. Predictors: (Constant), X2, x1 







ANOVA! 
Sum of . 
Squares df Mean Square F Sig: 


1 Regression | 1987725 2 99386.233 3487 045 
Residual 770670.9 27 28543.3357 
Total 469443.4 29 


a. Predictors: (Constant), X2, X1 
b. Dependent Variable: COST 





L3 























Coefficients? 
Coefficients Coeficients 95% Confidence thipival for B 
Model mirc NN Nm 
1 (Constant) 278.600 53.426 H 5.233 .000 169.979 
x1 80.300 75.556 211 1.053 .297 -74. 
X2 198.200 75.556 .520 2623 .014 









a. Dependent Variable: COST 


图 12. 18 虚拟 变量 模型 的 SPSS 输出 结果 
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一 个 参数 Bi SR B, 不 等 于 0. 或 者 等 价 地 断定 , 数据 提供 了 充分 的 证 据 表明 用 户 维护 的 平均 费用 在 三 


个 州 之 间 是 不 同 的 . 


b. EX B =u -Ai = 德 克 萨 斯 州 和 堪萨斯 州 的 平均 费用 之 差 , 想 求 B, 的 95% 置信 区 间 , 图 
12. 18 着 重 显示 的 区 间 是 (43. 172, 353.228). 因此 , 我 们 有 95% 置 信 认 为 , 32 us -ui 落 在 这 个 区 间 
内 ， 这 意味 着 德 克 萨 斯 州 用 户 的 平均 费用 比 堪 萨 斯 州 用 户 平均 费用 高 出 43. 17 ~ 353. 23 美元 中 的 任 
意 值 . 分 析 表 12. 6 中 数据 的 第 二 种 方法 是 方差 分 析 ， 或 者 ANOVA, ANOVA 是 第 13 章 和 第 14 章 的 


主要 内 容 . 


应 用 练习 

12.29 两 水 的 化 学 成 分 . 参考 练习 12.1, Journal of 
Agricultural, Biological, and Environmented Statistics 
(2005 年 3 月 ) 关 于 雨水 化 学 成 分 的 研究 . [BAR RI 
水 样本 中 的 硝酸 盐 浓 度 y (mg/L) 作为 水 源 ( 地 下 
水 、 地 表 水 、 地 上 水 ) 的 函数 模型 , 

a. 写 一 个 E(y) 作 为 定性 自 变量 的 函数 模型 . 
b. 解释 a 中 模型 的 每 个 B 参数. 

12.30 消防 员 的 情感 压力 . 考虑 练习 12.3, Journal 
of Human Stress 对 消防 员 的 研究 . 考虑 用 定性 变量 ， 
社会 援助 水 平 作为 情感 压力 y 的 预测 变量 . 假定 研 
究 的 4 个 社会 援助 水 平 是 : 没有 、 低 、 中等、 高. 

a. 写 一 个 E(y) 作 为 4 水平 社会 援助 的 函数 模型 . 

b. 解释 模型 中 的 g 参数 . 

c. 解释 怎样 检验 4 个 社会 援助 水 平 下 情感 压力 均 
值 之 间 的 差异 . 

12.31 有 机 蒸汽 的 吸附 率 . 考虑 练习 12. 5, Environ- 
mental Science & Technology 关于 有 BLA TALI IA 
3t. 考虑 利用 定性 变量 有 机 化 合 物 作为 保持 系数 y 
的 预测 变量 ,研究 的 5 种 有 机 化 合 物 是 : 3E, HB. 
氯仿 、 甲 醇和 苯 甲 醚 . 

a. 写 一 个 五 (y) 作 为 5 水平 的 有 机 化 合 物 函 数 
模型 . 

b. 解释 模型 中 的 6 参数 . 

c. 解释 怎样 检验 5 种 有 机 化 合 物 的 平均 保持 系数 
之 闻 的 差异 . 

12.32 磁 控 管 研究 . 一 位 电气 工程 师 想 比较 5 个 不 
同 牌子 磁 控 管 的 平均 寿命 (h). 从 每 个 牌子 中 随机 
挑选 10 个 磁 控 管 收集 数据 , 写 一 个 给 出 这 5 个 牌 
子平 均 寿 命 的 模型 ， 并 解释 模型 的 所 有 p 参数 . 

12.83 用 遮光 提高 牛奶 产量 . 由 于 佛罗里达 湿热 的 
气候 条 件 , 菜 牛 的 生长 速度 和 乳牛 的 牛奶 产量 在 
夏天 会 明显 下 降 . 但 是 , 农业 和 环境 工程 师 已 经 找 
到 一 种 设计 良好 的 遮 阴 建 筑 物 , 能 够 显著 增加 屯 
牛 的 牛奶 产量 , 在 一 次 试验 中 , 将 30 头 母 牛 分 成 3 


~ 


组 , 每 10 头 1 组 . 第 一 组 牛 在 一 个 人 造 的 遮 阴 建筑 

物 下 饲养 ; 第 二 组 在 树 戎 下 ; 第 三 组 没有 遮 阴 . 我 

们 感 兴趣 的 是 每 组 母 牛 的 平均 牛奶 产量 (加 仑 ). 

a. 指出 试验 中 的 自 变量 . : 

b. 写 一 个 联系 平均 牛奶 产量 E ( y) 和 自 变量 的 模 
型 ,指出 所 有 虚拟 变量 并 且 编 码 . 

c. 解释 模型 中 的 B 参数 . 

12.34 WERI kA. 哪 种 驱 虫 剂 驱 蚁 效果 最 好 ? 
Consumer Reports (2000 年 6 月 ) 检 验 了 14 种 声称 有 
效 的 驱 蚊 剂 产品 . 每 种 产品 分 类 为 液体 / 谊 状 或 者 
CORB. 产品 的 价格 (美元 ) 除 以 为 覆盖 皮肤 暴 
露 部 分 所 需要 的 驱 蚊 剂 数量 (大 约 1⁄3 388 81) 即 为 
每 次 使 用 成 本 值 . 测试 者 将 他 们 的 腹 膊 暴露 于 200 
REF, 最 长 的 保护 小 时 数 ( 以 半 小 时 增加 ) 作为 
有 效 性 度量 ,下 面 的 表 给 出 了 报告 的 数据 . 


使 用 RK 
驱 虫 剂 类 型 成 本 保护 
(美元 ) (h) 





Amway HourGuard 12 
Avon Skin-So-Soft 

Avon BugGuard Plus 
Ben' s Backyard Formula 
Bite Blocker 

BugOut 


WEIR 208 13.5 
气 雾 /喷雾 0.67 0.5 
液体 / 谊 状 。 1.00 2.0 
WEER 0.75 7.0 
WEER 00.46 3.0 
^W 01 6.0 
RRE 02 3.0 
气 雾 /喷雾 0.19 5.5 
A4X/WX 024 6.5 
气 雾 /喷雾 027 1.0 
气 雾 /喷雾 1.77 14.0 
WE CHAR 0.67 3.0 
WE BEIR — 0.36 7.0 
气 雾 /喷雾 ”2.75 240 
FFÆ: “Buzz off. ” Consumer Reports , June 2000. 


a. 假定 想 用 驱 蚊 剂 类 型 建立 每 次 使 用 成 本 (7y) 的 
模型 ,为 驱 蚊 剂 类 型 找 出 合理 个 数 的 虚拟 变量 ， 
并 写 出 模型 . 

b. 用 a 中 的 模型 拟 合 数据 . 


Cutter Skinsations 
Cutter Unscented 
Muskoll Ultra6 Hours 
Natrapel 

Off! Deep Woods 
Off! Skintastic 
Sawyer Deet Formula 


Repel Permanone 


490 


第 12 # 





c. AREER RK 00 D ERE (y) 的 有 
用 预测 量 的 原 假设 . 

d. 对 “进行 检验 , 给 出 适当 的 结论 , 取 a =0. 10. 

e. 如 果 因 变量 是 最 大 保护 小 时 数 (y) , 重复 a~d 
部 分 . l 

12.35 灭绝 的 新 西 兰 鸟 类 . Evolutionary Ecology 

Research (2003 年 7 月 ) 发 表 了 一 项 关于 新 西 兰 鸟 


类 总 体 中 灭绝 模式 的 研究 . NZBIRDS 文件 包含 了 新 


西 兰 毛利 殖民 时 期 132 种 鸟 类 的 飞行 能 力 (会 飞 或 

者 不 会 飞 )、 习性 (水 栖 、 陆 栖 或 者 生存 在 空中 )、 

筑 巢 地 (地 面 、 地 中 的 穴 、 树 、 地 面 上 的 洞 ) 、 Ag 

密度 (高 或 低 ) . €(€. PEDD, WYRE 

THE SIT) 和 灭绝 情况 (绝种 、 岛 上 不 存在 、 现 存 ) 

定性 数据 ， 以 及 身体 质量 (g) 和 和 蛋 长 (mm) 定量 

数据 . 

a. 写 一 个 平均 身体 质量 作为 飞行 能 力 的 函数 模型 . 

b. 号 一 个 平均 身体 质量 作为 食物 的 函数 模型 . 

e. 写 一 个 平均 蛋 长 作为 筑 集 地 的 函数 模型 . 

d. 用 a 中 模型 拟 合 数据 ,并 解释 6 的 估计 . 

e. 做 检验 来 确定 a 中 模型 在 估计 平均 身体 质量 时 
是 否 统计 有 用 (a =0.01). 

f Hi b 中 模型 拟 合 数据 ,并 解释 有 6 的 估计 . 

g. 做 检验 来 确定 b 中 模型 在 估计 平均 身体 质量 时 
是 否 统计 有 用 (a =0.01). 

h. 用 。 中 模型 拟 合 数据 , 并 解释 6B 的 估计 . 

i. 做 检验 确定 c 中 模型 在 估计 平均 蛋 长 时 是 否 统 
计 有 用 (a =0.01). 

12.36 ”蚊子 幼虫 的 密度 . 做 一 个 野外 试验 来 评估 有 

机 肥 对 蚊子 幼虫 平均 密度 的 影响 ( Journal of the 

American Mosquito Control Association, 1995 年 6 

月 ). 用 沟渠 中 的 水 灌 满 池塘 3 天 之 后 , 从 池塘 采 

集 幼虫 样品 . 第 二 个 幼虫 样本 是 灌 满 池塘 并 加 上 免 


的 部 便 作 肥料 3 个 星期 后 采集 的 . 所 有 样品 送 到 实 

验 室 , 数 出 每 个 样品 中 有 蚊子 幼虫 个 数 y. 

a. 写 一 个 比较 肥沃 池塘 里 发 现 的 平均 蚊子 幼虫 数 
与 天 然 池塘 中 平均 数 的 模型 . 

b. 解释 a 中 模型 系数 B. 

c. 对 检验 肥沃 池塘 的 平均 幼虫 密度 是 否 超过 天 然 
池塘 的 平均 密度 , 建立 原 假设 和 备 择 假设 . 

d. 与 a 中 模型 全 局 F 6363280 p 值 为 0.004 ,并 
解释 这 个 结果 . 


12.97 338 X574. 一 家 大 型 联合 农业 公司 最 


近 检 验 了 5 个 品种 的 豌豆 (A, B, C, DAE), 确 
定 刀 种 最 适 于 种 植 . 将 一 块 地 分 成 20 小 块 ,每 一 
FREU EE 4 块 地 种 植 , 表 中 给 出 了 每 一 块 地 的 产量 





GERE). 
DER 
A B C D E 
26.2 29.2 29.1 21.3 20.1 
24.3 28.1 30. 8 22.4 19.3 
21.8 27.3 33.9 24.3 19.9 
28.1 31.2 32. 8 21.8 22.1 

a. 利用 数据 拟 合 模型 ， 


y=po +B% tB, + Bxxs Bux, + £ 
其 中 , 对 于 品种 A, x, =1, 对 于 品种 B, x, =1, 
对 于 品种 C, x, 21, 对 于 品种 D, x = 1. 

. 解释 模型 中 所 有 估计 的 参数 . 

c. 这 个 模型 的 全 局 严 检 验 检 验 了 什么 样 的 原 假 设 
和 备 择 假 设 ? 用 参数 和 5 PREISE Hj di 
来 解释 假设 . 

. Ħa =0.05 检验 ec 的 假设 . 

- 求 品种 DA E 的 平均 产量 之 差 的 95% 置信 
区 间 . 


= 


e 


c 


12.7 定量 和 定性 自 变 量 模型 


最 有 意义 的 数据 分 析 问 题 也 许 是 那些 既 包 含 定 量 自 变量 也 包含 定性 自 变量 的 问题 . 例如 , 假定 
要 联系 三 种 不 同 的 燃料 类 型 一 一 石油 、 煤 和 混合 燃料 的 内 燃 机 发 动机 的 平均 性 能 E (y) 和 发 动机 的 
”速度 x(r/min)， 并 且 希 望 对 这 三 种 燃料 的 响应 都 用 一 阶 ( 直线 ) 模 型 建 模 ， 图 12. 19 给 出 了 这 三 种 关 
系 可 能 呈现 的 形式 . - 

因为 在 图 12. 19 中 直线 是 假设 的 ， 因此 产生 了 很 多 实际 问题 . 一 种 燃料 的 性 能 和 另 一 种 燃料 一 
样 好 吗 ， 即 这 三 种 类 型 燃料 的 平均 性 能 直线 有 不 同 吗 ? 平均 性 能 水 平 关 于 引擎 速度 的 增加 率 ,对 这 
三 种 燃料 类 型 是 否 不 同 , 即 三 条 直线 的 斜率 是 否 相 同 ? 注意 这 两 个 现实 问题 中 的 每 一 个 都 可 以 看 成 
是 关于 图 12. 19 中 三 条 直线 确定 的 参数 问题 . 为 回答 这 些 问题 , 必须 写 一 个 单独 的 线性 统计 模型 描 
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述 图 12. 19 的 三 条 直线 ,然后 通过 检验 模型 参数 的 假设 来 回答 这 些 现实 问题 . 


EQ) 


Bü N 
D Š 





l | | | | | | | 
0 500 1000 1500 2000 2500 3000 3500 4000 


引擎 速度 (minm) 





X 


图 12. 19 平均 性 能 ECy) 和 引擎 速度 x, 之 间 的 关系 图 


在 前 面 的 例子 中 , 响应 (发 动机 性 能 ) 是 两 个 自 变 量 的 函数 ,一 个 是 定量 变量 (引擎 速度 %) , 另 一 
个 是 定性 变量 (燃料 类 型 ). 检查 联系 E(y) 和 这 两 个 自 变量 可 能 构造 的 不 同 模型 

1. 平均 性 能 E(y) 和 引擎 速度 之 间 的 直线 关系 ,对 于 这 三 种 燃料 来 说 是 一 样 的 . 即 对 所 有 三 种 
燃料 只 用 一 条 线 就 能 描述 EC) 和 速度 x, 2 BJ BJ 3: # OLE 12. 20) 


E(y) 2Bo * Bis, 
x = 引擎 速度 
EQ) 
E 
È LL a, ERAAN 
B 





引擎 速度 (min) 
图 12. 20 对 于 所 有 燃料 类 型 , E(y) 和 x 之 间 的 关系 是 一 样 的 


2. 联系 平均 性 能 E(y) 和 发 动机 速度 的 直线 , 对 所 有 燃料 互 不 相同 , 但 是 速度 * 每 增加 r/min, 
E(y) 的 增加 率 是 相同 的 . 即 这 些 直 线 是 平行 的 , 但 是 有 不 同 的 y ARE LE 12.21). 
E(y) 2o +Bizi +B2x2 + Bax3 
x, = 发 动机 速度 
_ [1 ”如 果 燃 料 是 石油 
Kas fo 如 果 不 是 
{1 WRR EN 
Kas b 如 果 不 是 
注意 , 这 个 模型 本 质 上 是 一 个 定量 自 变量 和 一 个 定性 变量 的 一 阶 模型 的 组 合 : 
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一 元 定量 变量 的 一 阶 模型 ， EC) =p + 

三 水 平 的 一 元 定性 变量 模型 : E(y) =Bo ix, + Bax3 
这 里 «1, xz Rs 如 上 定义 . 这 个 模型 意味 着 两 个 自 变 量 (引擎 速度 +, 和 定性 变量 燃料 类 型 ) 之 间 没 
有 交互 作用 . 对 x 的 一 个 单位 变化 , EC) 的 改变 对 所 有 三 种 燃料 类 型 都 是 相等 的 ( 即 三 条 直线 的 他 
” 率 相等 ). 相应 于 每 个 自 变量 的 项 称 作 主 效应 项 , 因为 它们 不 含 交互 作用 . 


E(y) 





平均 性 能 
A 








引擎 速 度 (r/min) 
图 12.21 三 种 燃料 类 型 的 平行 响应 直线 


定义 12.4 回归 模型 中 所 有 涉及 某 个 变量 (定量 或 者 定性 ) 的 无 交互 作用 的 项 表示 那个 自 变量 
对 于 y 的 主 效应 ， 
3. 联系 平均 性 能 E(y) 和 引擎 速度 <, 之 间 的 直线 关系 ， 对 于 三 种 燃料 类 型 是 不 同 的 . 即 这 三 条 


直线 的 截 距 和 斜率 都 不 同 ( 见 图 12.22). 正如 所 看 到 的 ， 这 个 交互 作用 模型 是 通过 增加 交互 作用 项 
(两 个 自 变量 中 的 每 一 个 与 另 一 个 的 交叉 乘积 项 ) 得 到 的 ， 


lin Fm 交互 作用 
E(y) =Bo + Bizi +B% +B3x3 +Baxix, + Bsx1x3 
注意 前 面 的 每 个 模型 都 可 由 模型 1， 单个 一 阶 模型 用 于 所 有 三 种 燃料 的 响应 模型 ,增加 一些 项 而 
得 . 模型 2 是 由 增加 定性 变量 燃料 类 型 的 主 效应 项 而 得 ;模型 3 由 对 模型 2 添加 交互 作用 项 而 得 的 . 
因此 ,模型 是 岩 套 的 (模型 1 BUISTERU 2 和 模型 3 中 ; 模型 2 嵌 套 在 模型 3 中 ) ,在 12. 8 中 将 学 习 
怎样 比较 符 套 模型 ， 





平均 性 能 
EH 38 DH 
I = 


I l L l | | _ 
引擎 速度 (r/min) 


图 12.22 三 种 类 型 燃料 的 不 同 响应 直线 
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用 一 条 直线 (图 12. 20) 描 述 所 有 三 种 燃料 的 响应 呢 ? 还 是 用 三 条 如 图 12. 22 所 示 的 不 同 响应 下 
线 来 描述 ? 检验 单个 一 阶 模型 恰当 地 描述 了 所 有 三 种 燃料 的 (y) 和 引擎 速度 x 之 间 关 系 的 原 假 
Dz, 就 是 校 验 模型 3 的 参数 pB,, B, B, 和 ps SET O, HI 
Ho : B> =Bs - Bi =Bs =0 
的 原 假设 . 正如 在 下 一 节 中 我 们 将 看 到 的 , 用 完全 模型 (模型 3) 和 简化 模型 (模型 1) 的 比较 来 检验 这 
个 假设 . 
假定 三 种 燃料 的 响应 线 是 不 同 的 , 但 是 想 知道 数据 是 否 提供 了 充分 证 据 表明 这 几 条 直线 斜率 是 
不 同 的 . 为 检验 模型 2 充分 描述 了 EE(y) 和 引擎 速度 x1 之 间 关 系 的 原 假设 , 我 们 希望 检验 
Hy: B4 =Bs =0 
即 引 擎 速度 x, 和 定性 变量 燃料 类 型 这 两 个 自 变量 之 间 没 有 交互 作用 . 这 个 检验 可 以 通过 比较 完全 模 
型 (模型 3) 和 简化 模型 (模型 2) 来 完成 . 
将 合适 的 虚拟 变量 值 代入 模型 3 中 得 到 图 12.22 中 三 条 响应 直线 的 方程. 
ft ”刻画 图 12. 22 中 三 条 直线 的 完全 模型 是 : 
E(y) =Bo +Bix! +B% +B3x3 * Bax, Box xs 
其 中 ， 
x, = 引擎 速度 
[i 如果 是 石油 燃料 
7 lo 如 果 不 是 
_ [1 如 果 是 煤 燃 料 
7o 如 果 不 是 
检查 编码 可 以 看 到 当 使 用 混合 燃料 时 , x, = x =0. 将 这 些 值 代入 Ely) 的 表达 式 , 得 到 混合 燃料 的 直 
线 表达 式 : 
混合 燃料 线 
E(y) =Bo * Bixy +B>(0) +B3(0) +Bax1(0) +Bsx1(0) 289 + Bio, 
类 似 地 , 我 们 把 x。 和 zs 合适 的 值 代入 E(y) 的 表达 式 得 到 : 


石油 燃料 线 
E(y) - Bo *Bixi +B, (1) +B3(0) +Baxi(1) +Bsx1(0) 
gus gou 
7 (Bo +82) + (B1 * B4), 


E(y) 2o * Bixy * B3 (0) € 85 (1) * B4, (0) *Bsx, (1) 


A gu 
7 (Bo *B3) + (Bi * Bs) x 

如 果 拟 合 模型 3, 得 到 Bo, B1, --, B; 的 估计 ， 并 将 它们 代入 上 述 三 种 燃料 类 型 的 直线 方程 ,这 
与 使 用 三 条 不 同 的 直线 拟 合 三 个 燃料 数据 集合 中 的 每 一 个 所 得 的 预测 方程 是 -一样 的 . 那么 为 什么 不 
是 个 别 地 拟 合 这 三 条 直线 ? 为 什么 拟 合 一 个 将 所 有 三 条 直线 合并 成 同一 方程 的 模型 (模型 3 )? 答案 
Æ: 如 果 想 用 统计 检验 比较 这 三 条 燃料 类 型 直线 ， 就 需要 这 种 方法 . 我 们 需要 能 够 将 关于 直线 的 实 
际 问题 表示 为 模型 参数 集合 中 每 个 参数 等 于 0 的 假设 . 如 果 选 择 分 别 做 三 次 回归 分 析 ， 对 每 个 燃料 

数据 集 拟 合 一 条 直线 , 就 不 能 做 到 这 一 点 . 
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| 例 12.7 | 工业 工程 师 进行 一 项 试验 来 研究 两 个 制造 厂 , 工厂 A 联合 代表 制 的 与 另 一 家 非 联合 代表 
制 的 工厂 B, 工人 生产 率 和 薪酬 奖励 度量 之 间 的 关系 . 用 一 个 工人 在 4 周 , 每 周 40 h 内 可 能 生产 的 机 
器 铸件 数量 作为 每 个 工人 生产 率 y 的 度量 . 在 4 周期 间 每 个 工人 超过 1000 个 的 所 有 可 接收 的 生产 链 
件 支付 的 奖金 为 x1( 美 分 每 个 铸件 ). 从 每 个 工厂 挑选 9 个 工人 , 每 一 组 9 个 工人 中 指派 3 个 工人 得 
到 每 个 铸件 20 美 分 奖金 , 3 个 工人 得 到 每 个 铸件 30 美 分 奖金 , 3 个 工人 得 到 每 个 铸件 40 384 2 
这 18 个 工人 的 生产 率 数据 , 对 每 个 工厂 类 型 与 奖励 的 三 种 组 合 如 表 12. 7 所 示 . 

表 12.7 例 12.7 的 生产 率 数 据 























20£ /铸件 30£ /铸件 40£ /铸件 
工厂 类 型 
1512 1491 1529 1610 1601 1574 1636 
1512 1635 1589 1661 1645 1616 1689 





假定 一 阶 模型 2 对 发 现 平均 生产 率 E( y) 的 变化 作为 奖励 x, 的 函数 是 恰当 的 . 产生 两 条 生产 率 
直线 , 每 家 工厂 一 条 的 模型 是 : 
E(y) =Bo +Biz) + Box; Bax x; 
其 中 ， 
x = 奖励 
-J1 如 果 是 非 联合 工厂 
== [o 如 果 是 联合 工厂 
a， 用 模型 拟 合 数据 并 画 出 两 条 生产 率直 线 的 预测 方程 图 . 
b. 这 些 数据 是 否 提供 了 充足 的 证 据说 明 对 联合 工厂 和 非 联合 工厂 有 奖励 的 工人 生产 率 的 增加 
速度 是 不 同 的 ? 用 a = 0. 10 检验 . 
解 | 
a. 图 12.23 给 出 了 回归 分 析 的 MINITAB 输出 . 从 输出 中 读 出 的 参数 估计 可 得 预测 方程 : 
y=1365. 83 +6. 217x; +47. 78x; + 0. 033x, x, 
联合 工 广 的 预测 方程 可 以 通过 将 xz, =0 代入 一 般 预测 方程 得 到 ， 即 
了 = +É +É> (0) «B, (0) =Ó, B v, =1365. 83 46.2172, 
类 似 地 , 非 联合 工厂 的 预测 方程 是 将 x, =1 代入 一 般 预 测 方程 得 到 ， 即 


yai guy 


7 =É +É, +Ó +É3x1 ta = Bo + 有 xl +Ê (1) *Byx (1) = (Bo +Ê) + (Á, +Ê; )x, 
= (1365. 83 447. 78) + (6. 217 +0. 033)5, 21413. 61 +6. 250x; 
图 12. 24 给 出 了 预测 方程 的 MINITAB 图 . 注意 这 两 条 直线 的 斜率 几乎 一 样 (联合 工厂 是 6.217, 非 联 
合 工厂 是 6. 250 ) . 
b. 如 果 非 联合 工厂 有 奖励 的 生产 率 增加 速度 ( 即 斜 率 ) 与 联合 工厂 相应 的 斜率 不 同 ， 那么 交互 

作用 ( 即 6; ) 将 不 为 0. 因此 ,我 们 想 检 验 ， 
H, : Bs =0( 无 交互 作用 ) 
H, : B30( 有 交互 作用 ) 





O 虽然 模型 含有 x, 项 , 但 仍 是 定量 变量 x, 的 一 阶 模型 (图 形 为 直线 ). 变量 x; 是 模型 中 引入 或 删除 项 的 虚拟 变量 ,项 
的 阶 由 出 现在 此 项 中 的 定量 变量 决定 . 
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The regression equation is 


CASTINGS = 1366 + 6.22 INCENTIVE + 47.8 PDUMMY + 0.03 INC PDUM 


Predictor Coef 
Constant 1365.83 
INCENTIVE 6.217 
PDUMMY $7.78 
INC PDUM 0.033 


S - 40.8387 


Analysis of Variance 


Source DF 
Regression 3 
Residual Error 14 
Total 17 


R-Sq = 71.15 


57332 
23349 
80682 


SE Coef T P 
51.84 26.35 0.000 
1.667 3.73 0.002 
73.31 0.65 0.525 
2.358 VD 0.989 


R-Sq(adj) = 64.95 


SS MS F P 
19111 11.46 0.000 
1668 








图 12. 23 ”铸造 数据 完全 模型 的 MINITAB 输出 


Scatterplot of CASTINGS vs INCENTIVE 


CASTINGS 


20 


图 12.24 ”预测 方程 的 MINITAB 图 


1=NONUNION, O=UNION 


25 30 35 
INCENTIVE 








40 


用 了 检验 来 进行 这 个 检验 . 从 MINITAB 的 输出 中 看 出 , 检验 统计 量 和 相应 的 p 值 (着 重 显示 ) 为 


T=0.01 


p f& =0. 989 


因为 w =0. 10 F p 值 , 我 们 不 能 拒绝 原 假设 , 即 没有 足够 的 证 据 断 言 联 合 工厂 和 非 联合 工厂 的 形 
状 是 不 同 的 . 因此 , 这 个 检验 支持 我 们 在 b 中 看 到 的 两 个 几乎 相同 的 斜率 . 因为 交互 作用 不 显著 , 我 
们 从 模型 中 去 掉 x1x, 项 , 使 用 更 简单 的 模型 E(y) = Bo Bis, +B2x 来 预测 生产 效率 . 

UBERA EEN 12. 6, 假定 我 们 认为 柴油 发 动机 平均 发 动机 性 能 E(y) 和 引擎 速度 z, 之 间 是 如 图 


12. 25 所 示 的 二 阶 关 系 . 
a. 写 一 个 能 产生 如 图 12. 25 所 示 的 响应 曲线 E( y) 的 模型 方程 . 


b. 写 出 石油 燃料 的 曲线 方程 . 
c. 怎样 确定 a 中 的 模型 是 否 比 例 12. 6 的 一 阶 模型 E( y) 7Bo +Bix1 * Bax» * Byxsaxix, + Bsx1x3 
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给 出 y 的 更 好 预测 ? E(y) 
fg 
a. 今 » 
O a = 引擎 速度 MA 

of 如果 是 石油 燃料 煤 
=h 如 果 不 是 
[I 如果 是 煤 燃料 
`= 如 果 不 是 





因为 图 12.25 给 出 了 E(y) 和 引擎 速度 (x ) 之 间 的 曲线 o i 
关系 , 并 且 三 种 燃料 类 型 的 响应 曲线 是 不 同 的 ( 即 引擎 
速度 和 燃料 类 型 有 交互 作用 ) ,合适 的 模型 是 ， 


主 效应 ， 
燃料 类 型 


E(y) - Bo * Bixy +B>x1 + Bsxo +Bax3 + sx xs * Bonis + praia + Baix, 
注意 到 引擎 速度 的 每 个 主 效应 项 (x| 和 好 ) 乘 以 燃料 类 型 的 每 一 个 主 效应 项 (和 和 xs ) 得 到 模型 中 的 
4 个 交互 作用 项 . 
b. `x, =1 且 xs =0 时 ， 这 个 模型 给 出 了 燃料 为 石油 ( 见 代码 ) 的 E(y) 和 x, 之 间 的 关系 , 将 这 
些 值 代 入 模型 , 我 们 得 到 
E(y) =Bo +Bizi +ÜB>x1 * Bax, +B4xa + Bax xa +Bexix3 + Bax px, + Baxx, 
=Bo t Bii t Boi +B3(1) B4 (0) Bs (1) Bex (0) +8;2 (1) +Bax? (0) 
= ‘Bo * B3) * (6: +6; )x, + (B +B) 
c. a 中 的 模型 和 例 12. 6 的 一 阶 模型 唯一 的 不 同 是 包含 xi 的 项 . 因此 , 我 们 希望 检验 原 假设 ， 
“二 次 项 对 y 的 预测 没有 贡献 信息 ”, 即 


引擎 速度 


图 12.25 三 种 燃料 类 型 的 响应 曲线 


主 效应 ， 
引擎 速度 


Ho: B; =B; =Bs =0 
注意 这 个 检验 既 不 是 对 模型 里 所 有 B 的 全 面 FRE, 也 不 是 对 单个 B 的 了 检验 ,将 在 下 一 节 学 习 怎 
样 对 部 分 B 进行 这 个 检验 . 

前 几 节 给 出 的 模型 仅仅 是 统计 建 模 的 介绍 . 可 以 构建 联系 E(y) 与 任意 多 个 定量 和 (或 ) 定 性 自 
变量 的 模型 ,可 以 对 定性 变量 的 不 同 水 平 ， 或 者 两 个 或 更 多 定性 自 变 量 水 平 的 不 同 组 合 , 来 比较 响应 
曲线 和 曲面 . 

水 源 是 相同 的 , 画 出 模型 中 假设 关系 的 草图 . 


应 用 练习 
12.38 雨水 的 化 学 成 分 . 参见 练习 12.1, Journal of 
Agricultural, Biological ， and Environmental Statistics 
(2005 年 3 月) 研究 雨水 的 化 学 成 分 . 回想 雨水 样 
本 中 的 硝酸 盐 浓 度 (mg/L) 作为 水 源 (地 下 水 、 地 表 
水 和 地 上 水 ) 的 函数 建 模 , 现在 考虑 向 模型 添加 第 
二 个 自 变量 氧化 硅 密 度 ( mg/L). 
a. 写 出 ECy) 作为 自 变量 函数 的 一 阶 模型 ,假定 硝 
酸 盐 浓度 关于 氧化 硅 密 度 的 增加 率 对 所 有 三 种 


b. 写 出 ECy) 作 为 自 变量 函数 的 一 阶 模型 , 但 现在 假 
定 关于 硝酸 盐 浓度 的 增加 率 随 氧化 硅 密 度 对 三 种 
水 源 是 不 同 的 , 画 出 模型 中 假设 的 关系 草图 . 

12.39 有 机 蒸汽 的 吸附 率 . 参见 练习 12. 5, Environ- 
mental Science & Technology "£j SL 2& IR 附 作 用 研 
究 . 用 作 保 持 系数 y 建 模 的 自 变量 是 :x, = 温度 ( 度 )， 
x, = 相对 湿度 (百分比 ) ,有 机 化 合 物 = (E, PE, 
AD. PR, EPRE). 
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a. 写 出 E(y) 作 为 温度 和 有 机 化 合 物 函数 的 一 阶 主 
效应 模型 , 画 出 模型 草图 . 

b. 解释 a 中 模型 的 B 参数 . 

. 写 出 E(y) 作 为 相对 湿度 和 有 机 化 合 物 的 函数 模 
型 , 假设 5 种 化 合 物 有 不 同 的 保持 系数 一 相对 
湿度 斜率 , 画 出 模型 的 草图 . 

d. 给 出 c 模型 中 5 种 化 合 物 的 斜率 (用 项 表示 ). 

12.40 ”小麦 基因 的 RNA 分 析 . 华盛顿 州立 大 学 农 作 

物 与 土壤 科学 系 的 工程 师 用 回归 法 估计 一 个 从 小 

麦 提取 的 RNA 等 分 试 样 基 因 转 录 的 副本 数 .( Elec- 

tronic Journal of Biotechnology, 4. 15, 2004. ) M Æ 

露 在 寒冷 中 的 小 麦 提 取 的 RNA 比例 (x ) 是 变化 

的 , 测量 两 个 克隆 基因 : 锰 过 氧化 物 歧化 酶 (Mn- 

SOD) 和 磷脂 酶 D( PLD) 中 每 一 个 的 转录 副本 数 (y， 

以 千 计 ). 下 面 的 表 给 出 了 数据 . 


° 








副本 数 (y, F) 
RNA 比例 (2 ) MnSOD PLD 
0.00 401 80 
0.00 336 83 
0.00 337 75 
0.33 711 132 
0.33 637 148 
0.33 602 115 
0. 50 985 147 
0. 50 650 142 
0. 50 741 146 
0.67 904 146 
0.67 1007 150 
0.67 1047 184 
0. 80 1151 173 
0. 80 1008 201 
0. 80 1061 181 
1. 00 1261 193 
1. 00 1272 187 
1.00 1256 199 





资料 来 源 : Baek. K. H. , and Skinner. D. Z. * Quantitative Te- 
al-time PCR method to detect changes in specific transcript 
and total RNA amounts. ” Electronic Journal of Biotechnology , 
Vol.7, No.1, April 15, 2004( 由 图 2 改编 ). 


a. 写 出 副本 数 (7) 作为 提取 的 RNA 比例 (x; ) 和 基 
因 类 型 (MnSOD 或 PLD ) 函数 的 一 阶 模型 ,假定 
RNA 比例 和 蔡 因 类 型 对 y 有 交互 影响 . 
b. 用 a 中 模型 拟 合 数据 ,给 出 7 的 最 小 二 乘 预 测 方程 
c. 做 检验 确定 RNA 比例 和 基因 类 型 实际 上 是 否 有 
交互 作用 ,用 a =0. 01 检验 . 
d. JH b 的 结果 估计 随 基 因 类 型 MnSOD 提取 的 RNA 





比例 (x ) ,副本 数 (y) 的 增加 率 . 
e. 对 于 基因 类 型 PLD 重复 d. 


12.41 药品 的 保管 寿命. 礼 来 公司 根据 药物 的 效力 


开发 了 三 种 方法 (G、R, 和 R, ) 来 估计 药材 产品 的 

保管 寿命 . 比较 这 三 种 方法 的 一 种 途径 是 将 估计 

的 保管 寿命 y( 真实 保管 寿命 百分数 ) 作 为 响应 变 

量 , 药 效 (x ) 作 为 定量 预测 变量 , 方法 作为 定性 预 

测 变量 , 构建 一 个 回归 模型 . 

a. 号 出 E(y) 作 为 药 效 (x ) 和 方法 函数 的 一 阶 主 效 
应 模型 . 

b. 解释 a 中 模型 的 8 系数 . 

- 写 出 允许 三 种 方法 斜率 不 同 的 E(y) 一 阶 模型 . 

ERE c, 对 每 一 种 方法 , 用 有 写 出 yx, 直线 的 斜率 . 


e 


= 


12.42 被 污染 鱼 的 研究 . 考虑 练习 11. 22, 联系 被 污 


染 鱼 的 平均 DDT 水 平 E(y) M x, = 捕捉 地 离 河 口 

的 英里 数 , x, = 长度, x, = 重量 的 模型 . 现在 考虑 

E(y) 作 为 重量 和 种 类 (海峡 鲍鱼 、 大 嘴 钙 鱼 、 小 口 

胭脂 鱼 ) 的 函数 的 模型 . 

a. 为 种 类 设置 合适 的 虚拟 变量 . 

b. 写 出 模型 的 表达 式 , 建议 平均 DDT KE EAE 
量 之 间 具 有 平行 直线 关系 , 每 个 种 类 一 条 直线 . 

- 写 出 模型 的 表达 式 , 建议 平均 DDT KE EME 
量 之 间 具 有 非 平行 直线 关系 , 每 个 种 类 一 条 直线 . 
d. Hi b 中 的 模型 拟 合 保存 在 DDT 文件 的 数据 , 给 

出 最 小 二 乘 预测 方程 . 
. 考虑 d, 解释 乘 以 重量 B. 系数 的 最 小 二 乘 估计 值 . 
f. JH c 中 的 模型 拟 合 保存 在 DDT 文件 的 数据 ,给 出 
最 小 二 乘 预 测 方程 . 
g. 考虑 f, 对 海峡 角 鱼 求 联系 DDT 水 平 (y) 和 重量 
的 直线 的 估计 斜率 . 


° 


e 


12.43 d E ARES. 参见 练习 11.56, Journal of 


Applied Ecology WI Y 228 WE BJ E] 38 2J PE. 

a. 写 一 个 联系 幼 雁 重量 变化 (y) 与 消化 效率 (x ) 和 
食物 (植物 或 者 鸭 食 ) 的 一 阶 模型 ， 每 种 食物 允 
许 不 同 的 斜率 ， 

b. 用 a 中 的 模型 拟 合 保存 在 文件 SNOWCEESE 中 
的 数据 , 给 出 最 小 二 乘 预测 方程 , 

c. 对 以 植物 喂养 的 幼 雁 , 求 估 计 的 直线 斜率 ,解释 
这 个 值 . 

d. 对 以 鸭 食 喂养 的 幼 雁 , 求 佑 计 的 直线 斜率 ,解释 


O Murphy. J.R. , and Weisman. D. “Using Random Slopes for Estimating Shelf Life. "在 Joint Statistical Meetings, Anaheim, 


Calif. , Aug. 1990 上 发 表 的 文章 . 
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这 个 值 . 


e. 做 一 个 检验 确定 与 两 种 食物 关联 的 斜率 是 否 显 


著 不 同 , 用 a =0. 05. 
12.44 1 ë v 455r 30. 研究 蓝 色 山内 山脉 (田纳西 ) 


山坡 上 的 大 气 污染 . 文件 LEADMOSS 中 包含 了 从 
山坡 上 采集 的 70 个 萌 巷 样品 中 发 现 的 含 铅 水 平 
(ETLE TE E AE) HUE BERE b BOXER CER ) 和 山 
坡 面 的 朝向 (如 果 向 东 取 1, 如 果 向 西 取 0). 下 表 


给 出 了 数据 集 的 前 5 个 和 后 5 个 数据 . 





样 m 含 铝 水 平 海拔 坡 面 朝 向 
1 3. 475 2000 0 
2 3.359 2000 0 
3 3.877 2000 0 
4 4. 000 2500 0 
5 3.618 2500 0 
66 5.413 2500 1 
67 7.181 2500 1 
68 6. 589 2500 1 
69 6. 182 2000 1 
70 3. 706 2000 1 


资料 来 源 : Schilling, J. “ Bioindication of atmospheric heavy 


metal deposition in the Blue Ridge using the moss, Thuidium 


delicatulum. " Master of Science Thesis, Spring 2000. 


a. 写 出 联系 平均 含 铅 水 平 E (y) 和 海拔 z, 与 坡 面 
朝向 x, 之 间 的 一 阶 模型 表达 式 ,模型 包括 海拔 


和 坡 面 朝 向 之 间 的 交互 作用 . 


= 


平和 海拔 之 间 的 关系 . 
c. 用 a 中 模型 的 B 给 出 向 东 坡 面 苦 玫 海 拔 每 增加 1 
英尺 含 铝 水 平 的 变化 . 
利用 可 得 到 统计 软件 包 , 用 a 的 模型 拟 合 数据 ， 


a 


对 于 预测 含 铝 水 平 , 全 模型 是 否 统计 有 用 ? 用 


a =0. 10 检验 . 


e. 写 出 联系 平均 合 铅 水 平 (y) 与 海拔 (x, ) , 坡 面 


朝向 (%, ) 的 完全 二 阶 模型 . 


12.45 HiHi E. 佛罗里达 柑 村 委员 会 想 评 
个 两 种 榨 汁 机 品牌 A 和 品牌 B 的 性 能 ,认为 试验 所 
用 的 水 果 大 小 可 能 影响 橙汁 机 的 果 眷 产量 ( SEE 
榨 出 的 果汁 量 ). 委员 会 希望 找到 一 个 联系 平均 产 
量 E(y) 、 检 汗 机 的 类 型 (品牌 A 和 品牌 B) AET 


12.8 比较 幅 套 模型 的 检验 


- 画 出 a 中 模型 假设 对 不 同 坡 面 朝向 平均 含 铅 水 


大 小 (直径 )x 的 回归 模型 . 

a. 指出 自 变量 是 定性 还 是 定量 变量 . 

b. 写 一 个 描述 橙 的 大 小 和 E(y) 之 间 关 系 为 两 条 平 
行 直 线 的 模型 ,每 个 樟 橙 汁 机 品牌 一 条 . 

. 修改 b 中 模型 ,允许 两 条 直线 的 斜率 不 同 . 

IB Hi b RI c 模型 的 典型 响应 线 草图 , 仔细 地 标记 

你 的 图 . 

e. 对 预测 产量 确定 。 的 模型 是 否 比 b 的 模型 提供 

了 更 多 的 信息 , 给 出 所 用 的 原 假设 和 备 择 假设 . 


o 


> 


12.46 ”用 玻璃 器 亚 存储 核 废 料 . 因为 玻璃 不 易 辐射 损 


坏 , 把 核 废料 压缩 到 玻璃 中 认为 是 解决 环境 低 水 平 核 
废料 问题 的 最 有 前 途 方法 . 但 是 ， 当 玻璃 暴露 在 极端 
的 环境 时 , 琉璃 会 经 历 化 学 变化 , 并 且 它 的 一 些 成 分 
溶 人 周围 环 境 . 另外 , 这 些 化 学 反应 可 能 会 使 玻璃 恋 
35. 上 述 这 些 使 佛罗里达 大 学 材料 科学 工程 系 和 美 
国 能 源 部 联合 进行 一 项 研究 , 来 评估 玻璃 作 为 废料 
包装 材料 的 效用 ?. 制备 腐蚀 化 学 溶液 ( 称 为 腐蚀 
浴 ) 并 直接 用 于 包含 三 种 废料 (TDS-3A，, FE 和 AL) 
的 玻璃 样本 ; 随时 观察 化 学 反应 . 一 些 测量 的 关键 
变量 是 . 
yY= 在 试验 结束 时 溶液 中 发 现 的 硅 量 ( 百 万 分 
之 一 )〈 这 是 玻璃 的 损坏 度 和 释放 到 环境 中 放射 
性 核 素 量 代 表 的 度量 . ) 
x, = 腐蚀 浴 的 温度 (人 ) 
Ë 如 果 废 料 类 型 是 TDS-3A 
^ l0 WERKE 
un Ë 如 果 废 料 类 型 是 FE 
` lo WERE 
废料 类 型 AL 是 基准 水 平 . 假定 希望 建立 硅 量 y fF 
为 温度 (x ) 和 废料 类 型 (x,, x, ) 的 函数 模型 . 
a 写 一 个 模型 ,建议 硅 量 和 温度 之 间 是 平行 直线 
关系 , 三 种 废料 类 型 每 种 类 型 一 条 . 
b. 在 a 的 模型 中 添加 温度 和 废料 类 型 之 间 的 交互 项 
c. EIE b 中 模型 ， 对 每 种 废料 类 型 ， 给 出 联系 硅 和 
温度 直线 的 斜率 . 
d. 在 温度 -废料 类 型 存在 交互 作用 的 检验 中 ,给 
出 检验 的 原 假设 . ` 


在 回归 分 析 中 , 我 们 经 常 希望 确定 (以 高 的 置信 度 ) 候选 模型 集合 中 哪 一 个 最 好 地 拟 合 了 数据 . 


在 这 节 中 , 我 们 给 出 关于 嵌 套 模型 的 一 个 方法 . 





O 这 个 练习 的 背景 资料 由 佛罗里达 大 学 材料 科学 工程 系 的 Dr David Clark 提供 . 
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定义 12.5 如 果 一 个 模型 包含 了 另 一 个 模型 的 所 有 项 ， 并 且 至 少 有 一 个 额外 项 , 称 这 两 个 模型 
AREH. 

为 了 说 明 , 假定 已 经 收集 了 响应 y 和 两 个 定量 自 变量 x fll x, 的 数据 , 而 且 正 在 考虑 用 一 阶 还 是 二 
阶 模型 来 联系 天 (7y) A x, x2. 二 阶 模型 能 够 比 一 阶 模型 更 好 地 预测 y 吗 ? 为 了 回答 这 个 问题 , 检查 这 
两 个 模型 , 注意 二 阶 模型 包含 了 一 阶 模型 的 所 有 项 ， 并 且 多 了 三 个 附加 项 ZW B3, B, FIL Bs) 的 项 : 

一 阶 模 型 : E(y) =Bo +Bixi +B2x2 

二 阶 项 

二 阶 模型 : E(y) =B +81% +para +Bsx1x2 +Baxt + Bs22 
因此 , ET U. 因为 一 阶 模型 是 两 个 模型 中 比较 简单 的 一 个 , 我 们 说 一 阶 模型 被 谋 套 在 更 
复杂 的 二 阶 模型 里 . 

一 般 地 , 两 个 租 套 模型 中 较 复杂 的 一 个 称 作 完 全 (或 全 ) 模型, 两 个 中 比较 简单 的 一 个 称 作 简化 
模型 . 询问 二 阶 (或 者 完全 ) 模 型 对 于 y 的 预测 是 否 比 一 阶 (或 简化 ) 模 型 提供 更 多 的 信息 等 价 于 询问 
参数 Bs, B4 或 Bs 中 至 少 有 一 个 不 等 于 0, 即 模型 中 是 否 应 包含 牵涉 到 B; , B, 或 Bs 项 . 因此 , 为 了 检 
验 模型 中 是 否 应 该 包含 一 阶 项 ， Rivi au 

: Bi B4 =Bs =0 
( 即 二 阶 项 不 会 对 y 的 预测 提供 信息 . ARED 
H, : B3, B, 或 Bs 中 至 少 有 一 个 参数 不 等 于 0 
( 即 至 少 一 个 二 阶 项 对 y 的 预测 提供 信息 ). 

进行 这 个 检验 的 步骤 是 直观 的 . 首先 , 用 最 小 二 乘法 拟 合 简 化 模型 , 并 且 计 算 相 应 的 误差 平方 和 
SSEg (y 的 观测 值 和 预测 值 之 间 的 离 差 平 方 和 ). 其 次 , 拟 合 完全 模型 , 并 且 计 算 它 的 误差 平方 和 SSE. 
然后 计算 差 SSER - SSEc 来 比较 SSER 和 SSEc. 如 果 二 次 项 对 模型 有 贡献 , 那么 SSEG 应 该 比 SSER 小 很 
&, 差 SSEQ -SSEc 会 比较 大 . 差 越 大 , 完全 模型 比 简化 模型 提供 了 更 好 的 y 预测 的 证 据 分 量 越 重 . 

当 模 型 里 添加 新 的 项 时 , 误差 平方 和 总 是 减 小 . 问题 是 这 种 减 小 是 否 足够 大 , 使 得 可 以 断言 这 
不 仅仅 是 因为 模型 的 项 增加 以 及 偶然 性 引起 的 . 为 了 检验 二 次 项 参数 B;, B, 和 Bs 同时 等 于 0 的 原 假 
设 , 我 们 用 如 下 的 下 统计 量 : 

p = SSE 的 减少 /被 检验 的 B 参数 个 数 _ (SSER -SSEc)⁄3 
二 阶 模型 的 #2 SSEc/[n - (5 41)] 
当 误 差 项 e 的 标准 回归 假定 满足 , 并 且 二 次 项 的 6 参数 都 是 0( 即 H, 为 真 ) 时 , 正统 计量 服从 自由 度 为 
y, 23, v =n -6 的 下 分 布 . 注意 是 被 检验 的 B 参数 的 个 数 , vs 是 二 阶 模型 中 与 2 相应 的 自由 度 . 

如 果 二 次 项 对 模型 有 贡献 ( 即 H, 为 真 ), 我 们 期 望 玉 统计 量 取 大 值 . 因此 , 我 们 用 单 边 检验 ， 如 

果 玉 超过 某 个 临界 值 E. ,就 拒绝 Ho. 








比较 嵌 套 模型 的 斑 检 验 
简化 模型 : E(y) - B, +Bix + Bx, 
完全 模型 : Ely) =B * Bi, e + B,x, +B, x; t +B,z, 
| Ho: Ber =B,.: =: =8, =0 
H, :被 校 验 的 B 参 数 中 至 少 一 个 不 为 0 


(SSE, —SSEc)Z/(k-z) _ (SSE, -SSE,)/(H, 中 被 检验 的 B 个 数 ) 


检验 统计 量 : F = SSEQ/[n-(k«1)] ^ MSE; 
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其 中 ,SSEn = 简化 模型 的 误差 平方 和 ; SSE. = 完全 模型 的 误差 平方 和 ; MSE, = 完全 模型 的 均 方 误差 (sz ) ; 
-8g=Ho 中 指定 的 B 参 数 个 数 ( 即 被 检验 的 B 参 数 个 数 ); k+1 = 完全 模型 中 户 参 数 个 数 (包括 Bo); n= 总 
的 样本 容量 . 

拒绝 域 : F >F. 

其 中 下 的 分 子 自由 度 v =k-g， AEE HŽ p, =n - (k+1).. 














参见 例 12. 3, FERREE (x), EJH (a) 与 成 品质 量 (7) 的 二 阶 模型 . 这 些 数据 是 否 
提供 充分 的 证 据 表 明 二 次 项 好 P a 对 y 的 预测 贡献 了 信息 ,用 a=0.05 检验 . 
解 ” 为 了 确定 二 次 项 ( 即 曲 线 ) 是 否 为 y 的 预测 提供 了 信息 , 我 们 检验 


Ho : 8475 =0 
对 备 择 假设 
H, :参数 B, 9X B, 中 至 少 有 一 个 不 等 于 0 
ERREKEN E: 


完全 模型 : E(y) =Bo +Bixi * Bax; +B3%1 %3 & Bax? Box? 
简化 模型 : E(y) 2 Bo * Bixi +B% * Baix; 
图 12. 26 给 出 了 简化 模型 的 SAS 输出 . 





The REG Procedure 
Model: MODEL1 
Dependent Variable: QUALITY 
Number of Observations Read 27 
Number of Observations Used 27 


ñnalysis of Variance 


Sum of lean 


Source ! DF Squares Square F Value Pr >F 
Mode I ` 3 2425.041394 808.34731 3.08 0.0475 
Error 23 5036.40102 262.45222 
Corrected Total 26 8461 .44296 

Root MSE 16.20038 R-Square 0.2066 

Dependent Mean 66 . 96296 dj R-Sq 0.1935 

Coeff Var 24.13304 


Parameter Estimates 


Parameter Standard 





Variable DF Estimate Error t Value Pr > iti 
Intercent 1 -614.13981 466.16828 -1.32 9.2007 
TEMP 1 7.08639 5.15846 1.37 0.1828 
PRESSURE 1 13.88278 8.45253 1.64 0.1141 
TEMP PRESS 1 -0.14550 0.09353 -1.56 0.1335 








图 12.26 简化 模型 的 SAS 输出 
简化 模型 的 误差 平方 和 (图 12. 26 的 阴影 部 分 ) 是 : 
SSEn = 6036. 401 02 
为 了 进行 检验 , 还 需要 完全 模型 的 SSE 和 MSE, K] 12. 13 给 出 这 些 值 : 
SSEc =59. 178 43 
MSE, =2. 818 02 
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对 于 这 个 检验 , n=27, k=5, g =3, REH BAEk - z) =2. 因此 ， 基于 自由 度 =k-g=2 和 
T M JW 个 
检验 统计 量 ; r = SER — R MS Sm p 个 数 ) 


_ (6036. 401 02 - 59. 178 43)72 
- 2. 818 02 


检验 的 最 后 一 步 是 比较 这 个 计算 的 正 值 与 自由 度 m =2, n 221 的 表 中 值 . 对 于 a =0. 05, Foos = 
3. 47 ,那么 拒绝 域 是 





= 1060. 5 





拒绝 域 : F >3.47 ( 见 图 12.27) 
HARR F (BYEEJEA BR, BUTLER Foos =3.47, 我 们 拒绝 Ho, 并 且 断 定 ( 在 = = 0. 05) 2 
有 一 个 二 次 项 对 y 的 预测 贡献 了 信息 . 换 句 话说 ， 这 些 数据 支持 响应 面 的 弯曲 不 是 简单 地 由 于 数据 
的 随机 变异 性 的 观点 ,完全 二 阶 模型 似乎 比 简化 模型 提供 更 好 的 y 预测 . 


AP) 
i 











Foos = 3.47 (vi = 2, v) = 21) 
图 12.27 H,: B, =B, =0 的 下 检验 拒绝 域 


E: 这 种 吝 套 模型 下 检验 的 检验 统计 量 和 jp 值 可 以 用 统计 软件 得 到 . 这 些 值 在 图 12. 28 的 SAS 
输出 中 着 重 显示 . 因为 p 值 小 于 =0.05， 我 们 得 到 同样 的 结论 : 拒绝 Ho. 


Test CURV Results for Dependent Variable QUALITY 





Mean . . 
Source DF Square F Valhe Pr >F 
Numerator 2 2988.61130 1080.54 €.0001 
Denon inator 21 2.81802 





图 12.28 RERA FRAI SAS 输出 


假定 在 例 12.9 rh F 检验 产生 一 个 不 是 落 在 拒绝 域 中 的 检验 统计 量 ， 即 假定 没有 充分 的 证 据 
(a=0.05) 表 明 曲 率 项 对 产品 质量 的 预测 贡献 信息 ， 就 像 对 任何 假设 的 统计 检验 一 样 , 我 们 必须 对 
接受 Ho 保持 谨慎 ,因为 犯 第 开 类 错误 的 概率 是 未 知 的 . 但 是 , 大 部 分 使 用 回归 分 析 的 人 都 采用 节俭 
原则 . 即 在 发 现 两 个 竞争 模型 本 质 上 有 同样 预测 能 力 情况 下 ， 选取 有 B 个 数 最 少 的 模型 ( 即 比较 节俭 的 
模型 ) 节俭 原则 使 我 们 在 嵌 套 模型 的 检验 中 不 能 拒绝 Ho 时 ,选择 简单 (简化 ) 模 型 而 不 是 较 复 杂 
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的 完全 模型 . 


定义 12.6 ”节俭 模型 是 一 个 含有 较 少 个 B 参数 的 一 般 线 性 模型 . 在 两 个 竞争 模型 本 质 上 有 相同 
预测 能 力 ( 由 已 检验 确定 ) 情 形 下 ,选择 两 者 中 更 节俭 的 那个 . 

当 模 型 构建 中 候选 模型 是 说 套 模 型 时 ,本 节 提 出 的 下 检验 是 比较 这 些 模 型 的 合适 方法 . 然而 ， 
如 果 模型 不 是 吝 套 的 , 那么 下 检验 就 不 合适 了 . 在 这 种 情况 下 , 分 析 人 员 必 须 基于 R A s 那样 的 统 
计量 , 选择 最 好 模型 ， 基于 这 些 和 其 他 模型 恰当 性 的 数值 描述 性 度量 的 决策 不 可 能 用 个 可 靠 性 度 
量 来 支持 , 并 且 在 本 质 上 是 非常 主观 的 , 因此 记 住 这 些 很 重要 ， 


应 用 练习 

12.47 航空 公司 的 利益 . 从 1978 年 美国 航空 工业 解 
除 管制 以 来 , 研究 者 怀疑 解除 管制 是 否 能 保证 一 
个 真正 竞争 性 环境 . 如 果 是 这 样 , 任何 主要 航空 公 
司 的 利益 只 和 整体 工业 条 件 ( 例 如 可 支配 收入 和 市 
BREK, 与 那 条 航线 的 任何 不 变 特色 无 关 . 
用 多 元 回归 检验 这 个 利益 性 假设 (Transportation 
Journal, 1990 年 冬 ). n = 224 个 运输 年 份 的 数据 用 
于 拟 合 模型 : 

E(y) =B, * Byx, +B,x, *Byxs Er Bays, 

其 中 ,y= 收益 率 , x. = 实际 个 人 可 支配 收入 , x, = 
工业 市 场 份额 , x; ~ xo = 研究 中 调查 的 28 个 航空 
运输 业 的 虚拟 变量 ( 编码 为 0-1). 回归 结果 汇总 
在 表 中 ,解释 这 个 结果 ,利益 假设 得 到 支持 了 吗 ? 
| 





变 mW B 估计 t 值 p 
截 距 1. 2642 0.09 0. 9266 
xj - 0. 0022 - 0. 99 0. 8392 
x) 4. 8405 3.57 0. 0003 


X3 ~ X30 (未 给 出 ) 一 一 

R? =0. 3402 F( 完 全 模型 ) =3. 49 p Ù =0. 0001 

到 (检验 运输 业 虚 拟 变量 ) =3. 59 p fË =0. 0001 
资料 来 源 : Leigh, L. E. “Contestability in deregulated air- 
line markets; Some empirical tests. " Transportation Journal, 
Winter 1990, p. 55 (3€ 4). Reprinted from the Winter 1990 
issue of Transportation. Journal With the express permission. of 
the publisher, the American Society of Transportation and Lo- 


gistics, Inc. , for educational purposes only. 


12.48 内燃 机 发 动机 的 性 能 . 进行 一 个 试验 来 评估 
燃烧 人 造 燃 料 ( 来 源 于 煤 ) 和 石油 燃料 的 发 动机 性 
能 (Journal of Energy Resources Technology, 1990 年 3 
HO. 所 用 的 石油 燃料 是 从 菲利普 斯 化 学 公司 得 到 
的 2 号 内 燃 机 发 动机 燃料 (DF2) ,所 用 的 两 种 人 造 
燃料 : 混合 燃料 (50% 煤 、50% DF-2) 和 高 级 定时 混 
合 燃料 制 动 功率 (kW) 和 燃料 类 型 在 测试 时 是 变 


化 的 , 且 测 量 了 发 动机 性 能 . 下 表 给 出 了 性 能 
量 , 每 度 曲 轴 角 的 质量 燃烧 率 的 试验 结果 . 





制 动 功率 ,x 燃料 类 型 质量 燃烧 率 ,y 
4 DF-2 13.2 
4 混合 17.5 
4 高 级 定时 17.5 
6 DF-2 26.1 
6 混合 32.7 
6 高 级 定时 43.5 
8 DF-2 25.9 
8 混合 46.3 
8 高 级 定时 45.6 
10 DF2 30. 7 
10 混合 50.8 
10 高 级 定时 68.9 
12 DF-2 32.3 
12 混合 57.1 


GEB. Litzinger, T. A. , and Buzza, T. G. * Performance 
and emissions of a diesel engine using a coal-derived fuel. " 
Journal of Energy Resources Technology, Vol. 112, Mar, 
1990, p.32, X3. 


研究 者 拟 合 交 互 作用 模型 : 
E(y) =Bo * Bix, + B,x, Box, +B,x x, +Bsx (x, 
其 中 : 
y= 质量 燃烧 率 . 
x, 三 制 动 功率 (kW). 
uc Ë DF-2 燃料 


0 ”如 果 不 是 
. f! 混合 燃料 
” lo WERE 
SAS 输出 如 下 所 示 . 


a. 进行 检验 确定 制 动 功率 和 燃料 类 型 是 否 有 交互 
作用 ,用 a=0.01 检验 . 

b. 考虑 a 模 型 ,对 三 种 燃料 类 型 中 每 一 种 给 出 yx， 
直线 的 斜率 估计 . 





12. 49 
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Dependent Variable: BURNRATE 
finalysis of Variance 
Sum of Mean 
Source DF Squares Square F Value Pr >F 
Model 5 3253.37329 650.79586 25.65 <.0001 
Error 8 203.01000 25.37625 
Corrected Total 13 3456 .98929 
Root MSE 5.03748 用 -Square 0.9413 
Dependent Mean 36.292865 fidj RH-Sq 0.9045 
Coeff Var 13.88010 
Parameter Estimates 
Parameter Standard 
Variable DF Estimate Error t Value Pr > iti 
Intercent 1 -10.83000 8.27743 -1.31 0.2271 
POHER 1 7.81500 1.12642 5.94 0.0001 
x2 1 19.35000 10.68612 1.81 0.1078 
x3 1 12.79000 19.68612 1.20 0.2656 
PUMERX2 1 -5.57500 1.37957 -4.11 0.0034 
PDMERX3 1 -2.95000 1.37957 -2.14 0.0649 
Test INTERACT Results for Dependent Variable BURNRATE 
Mean 
Source DF Square F Value Pr > F 
Numerator 2 223.03750 8.73 0.0095 
Dehon inator 8 25.37625 





练习 12. 48 的 SAS 输出 结果 


学 生 的 科学 能 力 . American Educational Re- 
search Journal (1998 年 秋 ) 刊登 一 项 学 生 对 在 教室 
中 掌握 的 科学 能 力 理解 的 研究 ,用 一 阶 主 效应 模型 
来 预测 能 力 的 理解 (y) ,包括 下 面 的 自 变 量 : 
控制 变量 ， 

x, = 以 前 的 科学 态度 得 分 

x, = 科学 能 力 测试 得 分 

n =1， 如 果 是 男生 ; 女生 为 0 

x, =1, 如 果 是 1 班 的 学 生 ; 如 果 不 是 为 0 

xs =1, 如 果 是 3 班 的 学 生 ; 如 果 不 是 为 0 

xs =1, 如 果 是 4 班 的 学 生 ; 如 果 不 是 为 0 

x, =1, 如 果 是 5 班 的 学 生 ; 如 果 不 是 为 0 

x, —1, 如果 是 6 班 的 学 生 ; 如 果 不 是 为 0 
表现 行为 : 

xy = 主动 指导 行为 得 分 

xo = 被 动 参加 行为 得 分 

xn = 主动 操作 行为 得 分 
a. 假设 E(y) 的 一 阶 主 效应 模型 的 表达 式 . 
b. 研究 者 考虑 了 包含 控制 变量 和 表现 行为 变量 之 

间 所 有 可 能 的 交互 作用 模型 , 写 出 E(y) 的 这 个 
模型 表达 式 . 


c. 研究 人 员 确 认 b 的 模型 中 交互 作用 项 不 显著 ， 
因此 使 用 a 的 模型 进行 推断 , 解释 进行 交互 作 
用 检验 的 最 好 方法 ,给 出 这 个 检验 的 原 假设 . 

12.50 从 油 中 分 离 水 . 参见 练习 11.23, Journal of 

Cloolid and Interface Science 对 水 / 油 混合 物 的 研究 . 
回想 预测 电压 (y) 的 7 个 变量 中 的 3 个 是 体积 
(xw). BREC) 和 表面 活性 剂 浓度 (xs ). 研究 者 
拟 合 的 模型 是 : 
E(y) =B, +B,x, * Box, +B,x; c Bax x, + Bux xs 

a. 注意 模型 中 包括 了 扩散 期 体积 (x ) 和 含 盐 量 
(x, ) 之 间 与 扩散 期 体积 (x, ) 和 表面 活性 剂 浓度 
(xs ) 之 间 的 交互 作用 . 讨论 这 些 交互 作用 项 怎样 
影响 y AI a, 之 间 的 假设 关系 , 画 出 草图 支持 你 
HER. 

. 用 交互 作用 模型 拟 合 数据 . 这 个 模型 比 练习 
11.23 的 一 阶 模型 能 更 好 地 拟 合 数据 吗 ? 试 
解释 . 

. 解释 交互 作用 模型 的 B 估计 . 

检验 交互 作用 项 是 否 对 电压 (y) 的 预测 有 显著 的 

贡献 , 取 a =0. 05. 

12.51 地 震波 研究 . 考虑 练习 12.21, 一 位 勘探 地 震 


= 


e 


= 
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学 家 想 建 立 一 个 回归 模型 来 佑 计 地 震波 的 平均 信 
咒 比 ,考虑 的 模型 是 完全 二 阶 模 理 ， 
E(y) =B * Bis + Box, t Box, Bax, * Bx; 
其 中 : l 
y = 信 品 比 
x, = 小 波 频率 
x, = 小 波 振幅 

分 别 用 完全 模型 和 简化 模型 E(y) 2 Bo * Bi, + 

Bo% WE n = 12 个 数据 ， 得 到 下 面 的 结果 : SSE, = 

159. 94, MSE, = 26.66, SSE, = 2094.4, MSE, = 

232.7. 利用 a = 0.05 的 嵌 套 模型 下 检验 比较 这 两 

个 模型 ,能 得 出 什么 结论 ? 

12.52 语言 识别 器 . 参见 练习 12.22, Human Factors 

研究 计算 机 化 语言 识别 器 的 性 能 . 研究 人 员 构 建 了 

一 个 完成 任务 时 间 (y) 作为 准确 度 (%, ) 和 词汇 量 

(x, ) 函数 的 完全 二 阶 模型 . 

a. 为 检验 模型 的 二 次 项 对 y 的 预测 是 否 有 用 , 给 出 

b. a 中 检验 得 到 一 个 小 于 0.01 的 p 值 ,解释 这 个 结果 . 

12.53 消防 员 的 情感 压力 . 参见 练习 12.3, Journal 

of Human Stress 对 消防 员 的 研究 . 认为 这 里 给 出 的 

完全 二 阶 模型 能 充分 地 描述 两 组 消防 员 的 情感 压 

力 和 经 验 年 数 之 间 的 关系 ,其 中 一 组 暴露 于 化 学 火 

场 ， 而 另 一 组 没有 . 

E(y) =B, * Byx, tx tix, + B,x x, + Bsx?x, 

其 中 : 

y= 情感 压力 
x, = 经 验 (年 ) 
nofi BETREK 
` lo 没有 
a. 为 确定 情感 压力 关于 经 验 的 增加 率 对 于 两 组 消 
防 员 是 否 不 同 , 要 检验 的 假设 是 什么 ? 

b. 为 确定 平均 情感 压力 水 平 存在 不 同 是 否 可 以 归 
因 于 暴露 组 , 要 检验 的 假设 是 什么 ? 

. 用 二 阶 模型 拟 合 200 个 消防 员 样 本 采集 的 数据 ， 
结果 是 SSE =783. 90. 用 同样 的 数据 拟 合 简化 模 
型 有 7) =B * Byx, + 及 好, 得 SSE =795.23. 是 
否 有 充分 证 据 支持 两 组 消防 员 的 平均 情感 压力 
水 平 不 同 的 说 法 , 取 a = 0. 05. 

12.54 有 机 蒸汽 的 吸附 率 , 参见 练习 12. 39, Envi- 

ronmental Science & Technology 有 机 蒸汽 的 吸附 研 

究 . 考虑 用 定量 变量 相对 湿度 和 定性 变量 有 机 化 合 

物 (5 个 水 平 ) 为 保持 系数 y 建 模 . 


o 


a. 建立 联系 ECy) 和 相对 湿度 、 有 机 化 合 物 的 完全 
二 阶 模型 . n 

b. 在 怎样 的 条 件 下 , a 中 模型 的 响应 曲线 具有 相同 
的 形状 但 不 同 的 y 轴 截 距 ? 

c. 在 怎样 的 条 件 下 , a 中 模型 的 响应 曲线 是 平行 
直线 ? 

d. 在 怎样 的 条 件 下 ,a 中 模型 的 响应 曲线 是 完全 相 
同 的 ? 


12.55 混凝土 强度 试验 , 建筑 材料 工程 师 对 3 种 不 


同 的 水 泥 ( 干 、 潮 湿 、 湿 ) 来 铺设 混凝土 进行 试验 . 
因为 混凝土 路 面 的 抗 压强 度 作为 硬结 时 间 和 水 泥 
的 函数 而 变化 , 提出 下 面 的 主 效应 模型 ， 
E(y) =Bo +B% +B,x; + B3% 
其 中 : 
Y= 抗 压 强度 (klb/in? ) 
x, = 水 泥 的 硬结 时 间 ( 天 ) 
un f 潮湿 水 泥 
” lo ”如 果 不 是 
_ 1 湿 水 泥 
“= 如 果 不 是 

于 水 泥 是 基准 水 平 . 

a. 为 确定 3 种 水 泥 的 平均 抗 压强 度 是 否 不 同 , 应 检 
验 的 假设 是 什么 ? 

b. 利用 从 50 批 次 混凝土 样本 中 采集 的 数据 ， 拟 合 主 
效应 模型 . 得 SSE = 140. 5. 然后 用 简化 模型 E(y) = 
B, * Bx, 拟 合同 样 的 数据 , 得 SSE = 183.2. 检验 在 
a 中 阐述 的 假设 , 取 a =0. 05. 

e. 解释 怎样 检验 平均 抗 压强 度 E( y) 和 硬结 时 间 Xi 
之 间 的 线性 关系 的 斜率 因 水 泥 类 型 而 变化 的 
假设 . 

d. 写 一 个 二 阶 模型 ,使 得 对 3 种 水 泥 类 型 有 不 同 
响应 曲线 . 


`e. 解释 怎样 检验 这 3 条 响应 曲线 有 同样 形状 但 有 


不 同 的 y 轴 截 距 假设 ? 


12.56 ”机 器 停工 时 间 模 型 . 业务 经 理 有 兴趣 为 每 个 月 


机 器 因 修理 而 停工 的 期 望 时 间 长 度 E(y)(h) 作 为 机 

器 类 型 (001 或 者 002) 和 机 器 年 龄 (年 ) 的 函数 建 模 . 

a. 将 机 器 停工 时 间 (y) 作 为 机 器 年 龄 和 类 型 的 函数 
写 一 个 完全 二 阶 模型 . 

b. 给 出 为 确定 模型 中 二 次 项 是 否 必要 所 要 求 的 简 
化 模型 . 

e. 给 出 为 确定 机 器 类 型 项 是 否 必要 所 要 求 的 简化 
模型 . 
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“12.9 ”外 部 模型 确认 


回归 分 析 是 最 广泛 使 用 的 估计 和 预测 工具 之 一 . 一 个 看 来 似乎 是 响应 y 合适 预测 的 回归 模型 在 
。 实践 应 用 时 常常 表现 很 差 . 例如 , 预测 一 台 燃 汽轮机 引擎 的 热 耗 率 模型 , 尽管 基于 整体 模型 恰当 性 
检验 显示 模型 是 统计 有 用 的 , 但 在 收集 试验 数据 时 ,可 能 没有 考虑 到 尚未 出 现 过 的 温度 的 任何 极端 
变化 . 这 提出 了 一 个 重要 的 问题 , 能 很 好 地 拟 合 样本 数据 的 模型 , 在 应 用 于 新 的 数据 时 , 也 许 不 能 成 
功 的 预测 y. 由 于 这 个 原因 , 在 实际 中 使 用 回归 模型 之 前 , 除了 评价 它 的 恰当 性 之 外 , 评价 回归 模型 
的 有 效 性 是 重要 的 . 

在 第 11 章 中 , 给 出 了 几 种 检验 模型 恰当 性 (例如 整体 模型 恰当 性 的 检验 、 部 分 下 检验 、Ra Ms) 
的 方法 . 简单 地 说 , 检验 模型 的 恰当 性 牵涉 确定 回归 模型 能 否 恰当 地 拟 合 样本 数据 . 但 是 模型 确认 达 
涉 对 拟 合 的 回归 模型 将 在 实际 中 如 何 表现 的 评价 , 即 当 使 用 新 的 或 者 未 来 数据 时 , 它 有 多 成 功 . 已 经 
提出 了 很 多 模型 确认 的 方法 , 其 中 一 些 在 本 节 简 略 地 介绍 . 关于 如 何 应 用 这 些 方法 的 更 多 细节 , 需 
要 查阅 参考 文献 . 

1. 检查 预测 值 : 有 些 时 候 , 拟 合 回归 模型 的 预测 值 了 可 以 帮助 识别 一 个 无 效 的 模型 . 无 意义 或 
者 不 合理 的 预测 值 可 能 表明 模型 的 形式 不 正确 或 者 p 系数 估计 不 好 . 例如 , 一 个 二 值 响应 y 的 模型 ， 
这 里 y 是 0 或 1, 可 能 得 出 负 的 或 者 大 于 1 的 预测 概率 . 在 这 种 情况 下 , 使 用 者 可 能 希望 考虑 产生 预 
测 值 实际 上 在 0, 1 之 间 的 模型 0. 另 一 方面 , 如 果 拟 合 模 型 的 预测 值 看 起 来 都 是 合理 的 , 在 进行 进 一 
步 的 模型 有 效 性 检查 之 前 , 使 用 者 在 实际 中 不 应 该 用 这 个 模型 . 

2. 检查 估计 的 模型 参数 : 一 般 地 , 回归 模型 的 使 用 者 对 模型 参数 的 相对 大 小 和 符号 ( 正 或 负 ) 具 
有 某 些 知识 , 这 些 信 息 应 该 用 来 检查 B 系数 的 估计 . 与 预期 符号 相反 的 系数 , 或 者 值 特别 小 或 者 特 
别 大 的 系数 , 或 者 不 稳定 的 系数 ( 即 系数 具有 大 的 标准 误 ), 预先 警告 在 应 用 于 新 的 或 者 不 同 数据 
时 , 最 后 的 模型 性 能 可 能 很 差 . 

3. 为 预测 收集 新 数据 . 确认 一 个 回归 模型 的 最 有 效 的 方法 之 一 是 对 新 的 样本 预测 7. 直接 比较 新 
数据 的 预测 值 和 观测 值 , 可 以 确定 预测 的 准确 度 , 并 且 利用 这 个 信息 评价 这 个 模型 实际 上 表现 如 何 . 

基于 这 个 目的 , 已 经 提出 了 几 种 模型 有 效 性 的 度量 . 一 种 简单 的 方法 是 计算 被 模型 解释 的 新 数 
据 中 变异 性 的 百分比 R2 预测 ( 记 为 Roe), 并 且 将 它 与 最 终 模 型 的 最 小 二 乘 拟 合 的 决定 系数 RR 相 
比较 . 令 yi. y ，…， y. 表示 用 来 构建 和 拟 合 最 终 回归 模型 的 = 个 观测 值 ，yw 101， nsz o Snem 
示 新 数据 集合 中 的 m 个 观测 值 , 那么 


> (y; 一 ñ)? 
Rea = 1- I— | 
> Oi - 7)? 
EP $, 是 用 拟 合 模型 中 B 估计 值 的 第 i 个 观测 的 预测 值 , 7 是 原 数据 的 样本 均值 2 , 如 果 Rea 比 最 
小 二 乘 拟 合 的 RP BAR, 我 们 将 对 模型 的 实用 性 增加 信心 . 但 是 如 果 观 察 到 RE 显著 的 落差 , EK 
际 中 应 着 慎 地 用 这 个 模型 来 预测 . 





O 对 于 二 值 响应 y 提出 的 模型 是 logistic 回归 模型 , 
O 或 者 也 可 以 用 新 数据 的 样本 均值 . 


506 第 12 章 





可 以 在 最 小 二 乘 拟 合 的 均 方 误 差 MSE 和 均 方 预测 误差 


之 间 进 行 类 似 的 比较 , XX HK Jed IIR B 系数 的 个 数 ( 不 包括 Bo ). 无 论 决 定 使 用 哪 种 模型 有 效 性 的 
度量 , 新 数据 集合 中 观测 值 的 个 数 必须 足够 大 ， 以 便 可 靠 地 评估 模型 性 能 的 预测 . 例如 Montgomery、 
Peck 和 Vining(2001) 推荐 至 少 用 15 ~20 个 新 观测 值 . 

4. 数据 分 离 (交叉 确认 ) : 对 于 收集 新 数据 不 可 能 或 者 不 切实 际 的 情形 ， 可 以 将 原始 样本 数据 分 
成 两 部 分 , 一 部 分 用 来 估计 模型 参数 ， 男 一 部 分 用 来 评估 拟 合 模型 的 预测 能 力 . 数据 分 离 (或 者 交叉 
确认 ) 可 以 用 多 种 方法 来 完成 . 通常 的 方法 是 随机 地 指派 一 半 观 测 值 作为 估计 数据 集合 ， 男 一 半 作 为 
预测 数据 集合 . 从 而 可 以 计算 模型 有 效 性 的 度量 , 例如 Rire R MSE prea- 当然 对 数据 分 离 必须 有 
足够 多 的 观测 值 才 有 效 . 对 于 同样 大 小 的 估计 数据 集合 和 预测 数据 集合 ， 建议 整个 样本 至 少 有 n=2k 
+25 个 观测 值 ,这 里 是 模型 中 6 参数 的 个 数 [ 见 Snee( 1977) ]. 

5. 思 切 法 : 对 于 样本 数据 集合 太 小 而 不 能 用 数据 分 离 时 ， 可 以 用 一 种 称 作 刀 切 法 的 方法 ， 当 回 
归 模型 是 从 样本 中 删 去 (或 剔除 )y; 后 的 数据 点 拟 合 时 ， 得 到 的 第 i 个 观测 的 预测 值 记 为 Yay. A 
法 就 是 从 数据 集合 里 剔除 每 个 观测 值 ， 每 次 一 个 ， 并 计算 数据 集合 中 所 有 n 个 观测 的 差 y -7u E 
型 有 效 性 的 度量 , 例如 R 和 MSE, 用 下 式 计 算 ， 

2 E(y;- Y) )2 
Risckknife =l-—— 
XGi-y)» 
2142 
MSE ,knife = PR 
Bicis MSEiuuni 的 分 子 称 作 预测 平方 和 或 者 PRESS. 一 般 地 ，PRESS 将 比拟 合 模型 的 SSE K, 
因此 ，Rjeueie 比拟 合 模型 的 R 小 , MSE Lu 比拟 合 模型 的 MSE K. 对 模型 预测 未 来 观测 值 的 能 
力 ， 这 些 刀 切 法 度量 给 出 了 比 模型 恰当 性 通常 度量 更 保守 的 (或 者 更 现实 的 ) 评 价 . 

合适 的 模型 确认 方法 随 应 用 情况 不 同 是 变化 的 . 记 住 一 个 有 利 的 结果 仍然 不 能 保证 在 实际 中 模 

型 总 有 很 好 的 性 能 ,但 是 我 们 对 证 实 过 的 模型 比 简单 地 很 好 拟 合 样本 数据 的 模型 有 更 多 的 信任 . 


12.10 ”逐步 回归 


在 建立 一 个 模型 描述 响应 变量 y 时 ， 必须 选择 重要 的 项 包含 在 模型 中 , 列 出 潜在 重要 的 自 恋 量 
和 它们 相关 联 的 主 效应 和 交互 作用 项 可 能 非常 多 . 因此 ， 需要 客观 的 方法 从 中 第 选 出 不 重要 的 那些 
项 . 本 章 提 出 的 筛选 方法 称 为 逐步 回归 分 析 . 

从 大 多 数 流行 统计 软件 包 可 得 到 的 最 常用 逐步 回归 过 程 如 下 工作 : 使 用 者 首先 确定 响应 y 和 洪 在 
的 重要 自 变量 集合 41 , x, ，,…, wi 这 里 通常 是 很 大 的 . (注意 , 这 个 变量 集合 可 以 代表 一 阶 和 更 高 阶 
项 以 及 任何 可 能 会 提供 重要 信息 的 交互 作用 项 . ) 将 响应 变量 和 自 变量 输入 到 计算 机 中 , 开始 逐步 

步骤 1 计算 机 对 数据 拟 合 所 有 可 能 形 如 





O ”随机 划分 通常 用 于 没有 逻辑 基础 的 分 割 数据 情形 ， 对 其 他 更 正式 的 数据 分 离 技术 查询 参考 文献 . 
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步骤 2 


步骤 3 


E(y) =po + Biz; 
的 一 元 模型 , 对 于 每 一 个 模型 检验 原 假 设 
Hy: B, =0 
对 备 择 假设 
H,: B1 关 0 


利用 单个 B 参数 的 7( 或 等 价 的 下) 检验 来 进行 , 产生 最 大 (绝对 值 )7 值 的 自 变量 认为 
是 y 的 最 好 一 元 预测 变量 人 . 
现在 开始 逐步 程序 , 在 余下 的 (让 -~ 1) 个 自 变量 中 搜寻 形 如 

E(y) 2 Bo * Bix, * Bax; 
的 最 好 二 元 模型 , 这 可 由 拟 合 所 有 包含 x, 和 另外 (k - 1) 个 变量 中 的 每 一 个 选 作 第 二 个 
变量 x; 的 二 元 模型 来 实现 . 对 这 (一 1) 个 模型 (相应 于 余下 的 自 变量 a, i=2,3, o, 
妃 计 算 检验 Ho : B, =0 的 了 值 . 留 下 有 最 大 7 值 的 变量 , 并 称 这 个 变量 为 x. 

某 些 软件 包 在 这 点 有 方法 上 的 分 歧 . 比较 好 的 软件 包 在 这 时 会 返回 ,并 检查 在 Bx。 
被 加 到 模型 后 的 了 值 . 如 果 在 某 一 指定 的 a 水平 (如 a =0.10) 下 7 值 变 得 不 显著 ， 
则 去 掉 变量 1 , 并且 寻找 在 包含 忆 x, 项 时 产生 最 显著 了 值 的 B 参数 的 自 变量 . 另外 
些 包 不 再 检验 B, 直接 进行 第 3 步 . 

最 好 的 拟 合 模型 可 能 会 给 出 一 个 与 步骤 1 所 得 的 不 同色 值 , 因为 和 可 能 是 
相关 的 ,所 以 记 值 和 它 的 显著 性 从 第 1 步 到 第 2 步 时 通常 会 发 生变 化 . 由 于 这 个 原因 ， 
在 每 一 步 重新 检查 了 值 的 软件 包 更 受 欢迎 . 
逐步 过 程 现在 寻找 第 三 个 自 变 量 加 入 到 x, 和 x 的 模型 ， 即 寻找 形 如 

E(y) 2 Bo +Bix1 * Bax; + Bax; 
的 最 好 模型 , 为 此 , 我 们 用 和 1 ,xz 和 剩 下 的 (4 -2) 个 变量 中 的 每 二 个， 作为 可 能 的 a 
TUR BUB (k -2) 个 模型 . 仍然 选择 具有 最 大 了 值 的 自 变量 加 入 准则 , 称 这 个 最 好 的 自 
变量 为 第 三 个 变量 xs. 

较 好 的 程序 是 重新 检查 相应 于 x 和 zx, 系数 的 了 值 , 删 去 了 值 变 得 不 显著 的 变量 
继续 这 个 过 程 ,直到 对 模型 中 已 有 的 变量 不 能 发 现 (在 指定 的 a KEF REFN TIE 
的 自 变 量 . 





逐步 回归 的 结果 是 只 包含 在 某 一 指定 a 水 平 下 7 值 是 显著 项 的 模型 ， 因此 , 在 大 多 数 实际 情况 ， 
许多 自 变量 中 只 会 保留 几 个 . 但 重要 的 一 点 是 不 要 匆匆 作出 推断 所 有 对 预测 y 有 重要 作用 的 自 变量 
已 经 确认 , 或 所 有 不 重要 的 自 变 量 已 经 剔除 . 记 住 ， 逐步 过 程 只 用 真实 模型 系数 (B) 的 样本 估计 来 选 
择 重 要 的 变量 , 已 经 进行 过 了 很 多 次 单个 B 参数 的 + 检验 ， 在 选 人 和 噜 除 过 程 中 发 生 一 个 或 者 更 多 
错误 的 概率 是 很 高 的 ， 即 我 们 很 可 能 在 模型 里 包含 了 一 些 不 重要 的 自 变 量 ( 工 类 错误 )， 剔除 了 一 些 
重要 的 自 变 量 ( 工 类 错误 ). 

我 们 没 能 得 到 一 个 好 的 模型 ,还 有 另 一 个 原因 . 当 我 们 在 逐步 回归 中 选择 包含 的 变量 时 , 经 常 可 
能 遗漏 高 次 项 (为 了 保持 变量 个 数 是 可 管理 的 ) ， 所 以 可 能 一 开始 就 遗漏 了 模型 中 重要 项 . 因此 , 应 





O 注意 最 大 了 值 的 变量 也 是 与 y 有 最 大 的 皮尔 逊 乘积 矩 相关 系数 
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该 认识 到 逐步 回归 是 一 个 客观 筛选 过 程 . 

现在 , 我 们 用 逐步 过 程 考虑 筛选 变量 间 的 交互 作用 项 和 二 阶 项 (对 定量 变量 ). 最 好 是 与 用 于 筛 
选 变量 无 关 的 第 二 个 数据 集 来 建立 响应 曲面 模型 ,因此 逐步 过 程 的 结果 可 以 用 新 数据 部 分 验证 . 但 
E, 并 不 总 是 有 这 种 可 能 ,因为 在 很 多 实际 模型 情形 中 , 可 以 利用 的 只 有 少量 数据 . 

警告 : 在 用 逐步 回归 结果 推断 E(y) 和 所 得 的 一 阶 模型 中 自 变量 之 间 的 关系 时 要 保持 谨慎 . 首 - 
A, 已 经 进行 的 非常 多 次 了 检验 ,导致 犯 1 个 或 者 多 个 型 或 者 了 [型 错误 的 概率 较 大 . 第 二 , 逐步 回 
归 模 型 不 包括 任何 高 阶 项 或 者 交互 项 . 只 有 在 必要 时 ， 即 当 你 在 模型 建立 时 希望 在 大 量 可 能 重要 的 
自 变 量 中 确定 利用 哪些 自 变 量 时 ， 才 使 用 逐步 回归 . 

切记 , 不 要 被 逐步 过 程 中 产生 的 + 值 所 欺骗 一 过程 只 保留 最 大 了 值 的 自 变 量 . 同时 , 如 果 在 逐 
步 过 程 中 使 用 主 效 应 模型 , 那么 增加 交互 项 和 二 次 项 可 能 会 有 很 大 改善 . 
DEAD 假定 一 家 大 型 十 木工 程 公司 想 用 多 元 回归 为 行政 人 员 薪金 作为 经 验 、 教 育 .性别 和 其 他 
因素 的 函数 建 模 , 建立 模型 的 最 初步 骤 是 确定 最 重要 的 自 变量 , 表 12. 8 给 出 了 10 个 考虑 的 自 变量 . 
因为 利用 10 个 自 变 量 执行 完全 二 阶 模型 回归 分 析 是 很 难 的 , 我 们 需要 删除 那些 对 薪金 的 预测 贡献 
很 少 的 变量 (或 项 ). 100 个 行政 人 员 样本 的 薪金 数据 存储 在 文件 CIVILENG rp, 用 逐步 回归 决定 最 终 
的 模型 应 该 包括 10 个 变量 中 的 哪 几 个 

解 对 10 个 自 变量 的 主 效应 模型 进行 逐步 回归 分 析 , 确定 最 重要 的 变量 , 因 变量 y ETARE 
金 的 自然 对 数 , 图 12.29 给 出 了 MINITAB 逐步 回归 分 析 输 出 . Oè: MINITAB 在 第 一 步 自动 将 常数 项 
(Bo) 加 入 了 模型 . 剩 下 的 步骤 和 上 面 所 述 的 一 样 , 每 一 步 检验 的 了 值 和 相应 的 P 值 在 输出 中 着 重 显示 . ) 


表 12.8 例 12. 10 中 的 自 变 量 











H 变 E d æ 
1 经 验 (年 ) 一 一 定量 变量 
%2 教育 (年 ) 一 一 定量 变量 
25 工程 学 学 位 (如 果 有 , 则 为 1; 如 果 没 有 , 则 为 0) 一 一 定性 变量 
3a 管理 的 雇员 数 一 定量 变量 
Xs 公司 资产 ( 百 万 美元 ) 一 一 定量 变量 
Xe 董事 会 成 员 一 一 定性 变量 
x7 年 龄 (年 ) 一 一 定量 变量 
和 公司 收益 (过 去 的 12 个 月 , 百 万 美元 ) 一 一 定量 变量 
Xs 国际 职位 (如 果 有 , 则 为 1; 如 果 没 有 , 则 为 0) 一 一 定性 变量 


Aj 公司 的 总 销售 量 (过 去 的 12 个 月 , 百 万 美元 ) 一 一 定量 变量 
CCC 人 CC 


注意 ,包含 在 模型 中 的 第 一 个 变量 是 经 验 年 数 x ; 在 第 二 步 , 模型 中 加 入 工程 学 位 x ; 在 以 后 的 
步骤 中 , x4, xS 和 xs 进入 模型 . 在 w=0. 15(MINITAB 的 默认 值 ) 显 著 性 水 平 下 , 其 他 任何 x 不 能 进 
和 模型. 因此 , 逐步 回归 建议 在 最 终 的 建 模 中 将 集中 注意 5 个 变量 z), x2 ,x3, x Ñ xs. 

除了 逐步 回归 , 还 设计 了 其 他 更 主观 的 方法 带 助 选 择 “ 最 重要 ”的 自 变 量 . 例如 , 所 有 可 能 回归 
选择 程序 考虑 包括 潜在 重要 预测 因子 的 所 有 可 能 子 集 的 回归 模型 ; 基于 如 熟知 的 R2 和 MSE; 模型 统 
计量 和 其 他 统计 量 , 例如 PRESS 预测 平方 和 ) 和 Mallows C, (PRESS 和 C, 统计 量 的 细节 参见 文献 ) ; 
(由 研究 者 ) 选 择 变量 的 “最 好 ” 子 集 . 但 是 这 些 方法 , 缺乏 逐步 回归 的 客观 性 ， 并 且 ( 如 逐步 回归 ) 分 
析 者 在 使 用 这 些 方法 时 , 典型 地 忽略 了 潜在 变量 表 中 的 交互 作用 项 和 高 阶 项 . 
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(9) 应 用 练习 








Stepwise Regression: Y versus X1, X2, X3, X4, X5, X6, X7, X8, X9, X10 


Àlpha-to-Enter: 0.15  Alpha-to-Remove: 0.15 





Response is Y on 10 predictors, with N = 100 
Step. i 2 3 bio 5 
Constant 11.091 10.968 10.783 10.278 9.962 
xi 0.0278 0.0273 0.0273 . 0.0273 0.0273 
T-Yalue 12.6? ^ 15.13 18.80 24.68 26.50 
P-Value pono 0.000 0.000 0.000 0.000 
x3 0.197 0.233 0.232 0.225 
T-Value Exon 10.17 13.30 13.74 
P-Value gung 0.000 0.000 0.000 
x4 0.00048 0.00055 0.00052 
T-Value 4:32 10.92 11.06 
P-Value 0.000 0.000 0.000 
XR 0.0300 0.0291 
T-Value 8.28 8.72 
P-Yalue 32:000 0.000 
x5 0.00196 
T-Yalue 13,95 
P-Value B. nga 
Š 0.161 0.131 0.106 0.0807 0.0751 
R-8q 61.90 74.92 83.91 90.75 92.06 
R-3q(ad3) $1.51 74.40 83.41 90.36 91.64 
C-p 343.9 195.5 93.8 16.8 3.6 
PRESS 2.56387 1.78796 1.17124 0.695637 0.610197 
R-Sq(pred) 60.14 73.24 82.47 89.59 90.87 | 








图 12. 29 ”土木 工程 师 薪金 的 MINITAB 逐步 回归 结果 


12.57 ”逐步 回归 . 有 6 个 自 变 量 xi, %2, Xa, X4, Xs 
lx ， 对 预测 响应 y 可 能 有 用 . BUS. n = 50 个 观测 
值 , 决定 用 逐步 回归 帮助 选择 有 用 的 自 变量 . 
a. 在 第 1 步 有 多 少 个 模型 拟 合 数 据 ? 给 出 这 些 模 


型 的 一 般 形式 . 


b. 下 表 给 出 了 第 一 步 的 模型 中 对 每 个 自 变量 拟 合 
的 B, 估计 值 和 标准 误差 , 利用 这 个 结果 确定 哪 
个 自 变量 是 y 的 最 好 一 元 预测 变量 . 





B 变 E ñ, 5$, 
" 1.6 0. 42 
x -0.9 0.01 
X 3.4 1.14 
i 2.5 2.06 
xs -4.4 0. 73 
Xg 0.3 0.35 


c. 在 第 2 步 有 多 少 个 模型 拟 合 数据 ? 给 出 这 些 模 
型 的 一 般 形 式 . 

d. 解释 过 程 怎样 决定 什么 时 候 停止 向 模型 中 添加 
自 变 量 . 

e. 给 出 利用 最 终 逐 步 回归 模型 作为 Ely) 的 “最 好 ” 
模型 的 两 个 主要 缺点 . 


12. 58 ”物种 充裕 建 模 . EPA 请 一 位 海洋 生物 学 家 来 


确定 位 于 大 的 海湾 附近 某 个 发 电厂 的 热 水 径 流 是 否 
对 那个 地 区 的 海洋 生物 有 不 利 的 影响 , 生物 学 家 的 
目的 是 得 到 海洋 里 某 个 指定 区 域 或 位 置 的 海洋 动物 
数目 的 预测 方程 . 根据 过 去 的 经 验 , EPA 认为 下 面 
的 环境 因素 作为 特定 位 置 动 物 数量 的 预测 变量 : 

x, = 水 的 温度 (TEMP) 

x, = 水 的 含 盐 量 (SAL) 

x, = 水 中 溶 氧 量 (DO) 

x, = 浑浊 指数 , 水 的 浑浊 性 度量 (TID) 
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xs = 位 置 的 水 深 ( ST_DEPTH) 

x, = 抽样 区 域 中 海草 的 总 重量 (TGRSWT) 
作为 建立 模型 的 第 一 步 , 生物 学 家 用 逐步 回归 过 程 识 
别 这 6 个 变量 中 最 重要 的 自 变量 . 在 海湾 的 不 同位 置 
共 采 集 了 716 个 样品 , SPSS 的 输出 结果 如 下 (响应 变 
量 是 抽样 区 域 发 现 的 海洋 动物 个 数 的 对 数 y). 

a. 根据 SPSS 输出 , 这 6 个 自 变量 中 的 哪些 应 该 用 
于 模型 中 . 

b. 是 否 能 假设 海洋 生物 学 家 已 经 识别 了 所 有 对 y 
预测 重要 的 自 变量 ? 为 什么 ? 

c. 用 a 中 指出 的 变量 . 写 出 可 能 对 预测 有 用 的 交互 


作用 的 一 阶 模型 . 

d. 海洋 生物 学 家 怎样 判断 c 中 指定 的 模型 是 否 比 
一 阶 模型 好 . 

e. 注意 R° 的 较 小 取 值 . 生物 学 家 可 能 采取 什么 行 
动 改善 这 个 模型 . 


12.59 公共 汽车 快速 营运 研究 . 公共 汽车 快速 营运 
(BRT) 在 美国 公共 运输 提供 中 具有 迅速 发 展 的 趋 
9^, 南 佛罗里达 大 学 的 城市 运输 研究 中 心 ( CUTR) 
对 迈阿密 的 BRT 用 户 进行 了 一 次 调查 ,( Transpor- 
tation Research, 2003 年 1 月 ) 从 500 多 位 公共 汽车 
乘客 的 样本 中 收集 了 下 列 变量 的 数据 (都 以 5 分 制 
度量 , D “非常 不 满意 ”, 5 =“ 非 常 满意 ”) BRT 
整体 满意 度 (y) 、 公 共 汽 车 的 安全 度 (x ) 、 座 位 的 
可 用 性 (x,)、 可 靠 性 (%,)、 旅 途 时 间 (xs)、 费 用 
C ) 、 信 息 / 地 图 (x ) 、 路 线 的 便利 性 (x, ) 、 交 通 
信和 号 (x。)、 公 交 站 的 安全 性 (x )、 保养 的 时 间 
(wo) 和 保养 的 频率 (x ). CUTR 分 析 者 用 逐步 回 


归 为 整体 满意 度 (y) 建 模 . 

a. 逐步 回归 的 第 1 步 拟 合 多 少 个 模型 . 

b. 逐步 回归 的 第 2 步 拟 合 多 少 个 模型 . 

c. 逐步 回归 的 第 11 步 拟 合 多 少 个 模型 . 

d. 逐步 回归 选择 了 下 面 8 个 变量 包含 在 模型 中 ( 按 
选择 的 顺序 ) Xit Ka, Xy, Xr, Xios Xy, Zo Ala, 
号 出 由 逐步 回归 得 到 的 E(y) 方 程式 . 

e. d 中 模型 得 出 天 =0. 677, 解释 这 个 值 . 

f. 解释 为 什么 CUTR 分 析 员 在 断定 已 经 找到 了 “最 
好 ”的 E(y) 模 型 时 应 该 很 谨慎 . 

12.00 合金 钢 的 抗原 强度 . 佛罗里达 大 学 的 工业 工程 
师 把 回归 模型 作为 减少 新 开发 金属 合金 的 时 间 和 花费 
的 工具 . (Modelling and Simulation in Materials Science 

_and Engineering , Vol. 13, 2005. ) 为 了 说 明 ,工程 师 为 
一 种 新 型 合金 钢 的 拉 伸 届 服 强度 (y) 建 立 了 回归 模 
型 , 下 表 给 出 了 抗 届 强度 的 可 能 重要 的 预测 变量 . 

x = 合 碳 量 (% 重 量 ). 
n = 含 锰 量 (和 % 重 量 ) 
3, = 含 铬 有 量 (% 重量) 
x, = 含 镍 量 (% 重 量 ) 
xs = 合 钻 量 (% 重 量 ) 
Xe = 售 铜 量 (% 重 量 ) 
xç = 含 氮 量 (% 重 量 ) 
xg = SABE ( % ERE) 


xo = 板 厚度 (mm) 
xio = 溶液 处 理 (mmy) 
Xl = 时 效 温度 ( C ) 


Variables Entered/Removed? 


Variables Variables 
Model Entered Removed 


1 ST_DEPTH 














TGRSWT 





TI 








a. Dependent Variable: LOGNUM 


1 
2 


Model Summary 








a. Predictors: (Constant), ST_DEPTH 





Stepwise (Criteria: Probability-of-F-to-enter <= .050, 
' | Probability-of-F-to-remove >= .100). 
Stepwise (Criteria: Probahility-of-F-to-enter <= .050, 
` | Probability-of-F-to-remove >= .100) 
Stepwise (Criteria: Probability-ot-F-to-enter <= 050, 
Probability-of-F-to-remove >= 


Adjusted Std. Error of 

R Square | R Square the Estimate 

.329a .122 .121 
427 .182 .180 


3 A32" .187 184 









100). 












.7615773 
7948470 
7348459 















b. Predictors: (Constant), ST DEPTH, TGRSWT 
€. Predictors: (Constant), ST. DEPTH, TGRSWT, TI 


练习 12. 58 的 SPSS 输出 
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. 工程 师 发 现 变 量 镍 (% ) 与 其 他 可 能 的 自 变量 高 
度 相关 , 因此 , 镍 不 包含 在 模型 里 . 同意 这 个 决 
策 吗 ? 给 出 解释 . 

b. 工程 师 对 剩 下 的 10 个 可 能 自 变量 用 逐步 回归 分 
析 寻 找 预 测 变量 的 节俭 集合 . 同意 这 个 决策 吗 ? 
给 出 解释 . 

. 逐步 回归 选择 了 下 面 的 自 变 量 ; x, = 含 碳 量 , x, = 
RAE, x; = 含 铬 量 , x; = 含 钼 量 , x, = 含 铜 量 ， 
x = EL, x = 板 厚度 , xio = 溶液 处 理 , xu = 
时 效 温 度 . 所 有 这 些 变量 在 逐步 模型 上 都 是 统计 
显著 的 , R =0. 94. 因此 , 工程 师 用 估计 的 逐步 模 
型 预测 抗 届 强度 . 你 同意 这 个 决策 吗 ? 请 给 出 
解释 . 


[=] 


e 


12.61. 软件 成 果 估 计 的 精确 度 . 软件 工程 师 必须 定期 


提供 它们 在 开发 新 软件 中 的 成 果 的 估计 . 在 Journal 
of Empirical Software Engineering( Vol.9, 2004) 中 , 用 
多 元 回归 预测 这 些 成 果 估计 的 准确 度 . 定义 因 变 量 
为 估计 成 果 的 相对 误差 ， I 

y = (真实 成 果 - 估计 成 果 )/( 真 实 成 果 ) 
对 n=49 个 软件 开发 任务 样本 中 的 每 一 个 任务 确定 
因 变 量 . 对 8 个 自 变量 作为 相对 误差 的 预测 变量 赋 
值 , 这 些 变量 中 的 每 一 个 都 表述 为 如 表 中 所 示 的 虚 
拟 变量 . 
估计 者 的 公司 角色 : x =1, 如 果 是 开发 者 

0, 如 果 是 项 目 领 导 





快速 回顾 
重要 公式 





任务 复杂 度 : x, =1, 如 果 是 低 的 
0, 如 果 是 中 等 的 或 者 高 的 
合同 类 型 : xs -1, 如 果 固 定价 格 
0, 如 果 是 小 时 工资 率 
顾客 的 重要 性 : x4 =1, 如 果 是 高 的 
0, 如 果 是 低 的 或 者 中 等 的 
顾客 优先 考虑 的 : xs = 1, 如 果 是 交 货 时 间 
0, 如 果 是 花费 或 质量 
知识 水 平 : zç =1, 如 果 是 高 的 
0, 如 果 是 低 的 或 中 等 的 
参与 : x. =1, 如 果 是 估计 者 参与 了 工作 
0, 如 果 是 没 参与 的 
以 前 的 准确 度 : xs =1, 如 果 大 于 20% 准确 度 
0, 如 果 少 于 2095 


a. 逐步 回归 中 包含 8 个 自 变量 , 下 面 两 个 变量 被 先 
和 人 模型: x, 和 zx. 写 出 E(y) 作 为 这 两 个 变量 函数 
的 主 效应 模型 . 

b. 逐步 回归 产生 下 面 的 预测 方程 

7=0. 12 - 0. 28x, +0. 27x, 
Z8 USE x, 和 x 的 系数 B 估计 值 的 实际 解释 . 

e. 研究 人 员 关 心 模型 中 房 的 符号 与 预期 的 相反 . 
(研究 人 员 期 望 项 目 领 导 者 比 开发 者 有 较 小 的 估 
计量 的 相对 误差 . ) 至 少 给 出 一 个 原因 说 明 为 什 
么 发 生 这 种 现象 . 


E(y) =Bo * Bx 一 元 定量 变量 x 的 一 阶 模型 


E(y) =B * Bix + fx? 


一 元 定量 变量 * 的 二 阶 模型 


- E(y) - Bo +Bix t Bosh e e Bus? 一 元 定量 变量 x 的 p 阶 多 项 式 模型 
E(y) =P +Bixi t Box; +… + Bex k TERZE x 的 一 阶 模型 
E(y) 2 Bo * Byxy * fox; * Bax x, 二 元 定量 变量 x 的 交互 作用 模型 


E(y) = Bo +Bix1 Bax; Box x, +B, (x1 )2 +B; (x, )° 
E(y) =Bo *Bixi * Bs +> +B, asa 
F- (SSE, - SSEc )/ (293600 B CO) 





二 元 定量 变量 x 的 完全 二 阶 模型 
上 水 平 的 一 元 定性 变量 x 的 虚拟 变量 模型 


MSE, 比较 完全 和 简化 嵌 套 模型 的 检验 统计 量 


u=(x- x )/s, 
ntm 


X Gi - $)? 


2 i=nt+l 
R pred =1- n 


+m 
> (y; - y» 
izn4l 





给 一 个 定量 变量 x 编码 


交叉 确认 的 到 
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(E) 
an 一 
> i ( yi 一 ĵi ) 2 . 
MSE pred = m- 交叉 确认 的 MSE 
> (y; - Y) ) . 
[o 用 刀 切 法 进行 模型 确认 的 2 
> (y; - y)° 
i-i 
> (y; TYG) )? _ 、 
MSE ;sekknite = n-(k«D 用 刀 切 法 进行 模型 确认 的 MSE 
符号 汇集 
、 、 
符 = 读 法 说 明 
SSEnr S-S-E-R MERE 8520125 Jr 
SSE,. S-S-E-C TERE) ERI BUR SEE qil 
MSE, M-S-E-C 564 (WS ERE M Jp ia 
RI 有 R -平方 -预测 交叉 确认 的 R2 CR? 预测 ) 
MSE prod M-S-E- 预 测 交叉 确认 的 MSE( 均 方 预测 误差 ) 
MSE jsokknife M-S-E-7] HJ% 用 刀 切 法 进行 模型 确认 的 MSE 
PRESS 刀 切 法 的 预测 平方 和 
fo y-hat-i WRA i MIE y 的 预测 值 
本 章 总 结 提示 


”模型 构建 是 一 个 包含 拟 合 且 评 价 一 系列 EO) 的 模型， 达到 选 出 一 个 “最 好 "模型 的 过 程 

° 自 变量 不 同 强度 的 设 定 ( 值 ) 称 为 水 平 . 

MURAT a, 每 1 单位 变化 引起 的 有 (7) 变 化 依赖 于 x 的 固定 值 , 称 这 两 个 定量 自 变量 有 交互 作用 
给 一 个 定量 自 变量 x 编码 有 助 于 减少 出 现在 模型 中 的 x 和 wx? 的 固有 多 重 共 线性 . 

如 果 一 个 模型 ( 称 为 完全 模型 ) 包 含 另 一 个 (简化) 模型 中 的 所 有 项 及 至 少 -个 附加 项 , 称 这 
两 个 模型 是 嵌 套 的 . 

节俭 模型 是 含有 少量 6 参数 的 模型 . 

BW RE) 变量 用 于 表示 模型 中 的 定性 自 变 量 , 对 一 个 水 平 的 定性 变量 , 有 (上 _ 1) 个 虚拟 
变量 . 

模型 有 效 性 是 评价 估计 的 回归 模型 用 于 新 的 或 未 来 数据 时 , 模型 将 会 如 何 表现 . 

数据 分 离 (或 交叉 确认 ) 是 要 求 分 割 样 本 数据 集合 的 模型 确认 方法 . 一 个 数据 子 集 用 来 估计 模 
型 ， 另 一 个 子 集 用 来 确认 模型 

刀 切 法 是 用 于 样本 容量 较 小 时 的 模型 确认 方法 . 刀 切 法 预测 值 7,; 是 从 删除 第 i 个 观测 值 后 ， 
拟 合 (n - 1) 个 数据 点 的 回归 模型 中 得 到 的 y 的 预测 值 . ， 
逐步 回归 是 从 一 长 列 潜在 自 变量 中 入 分 最 不 重要 自 变量 的 客观 的 方法 。 

用 逐步 回归 模型 作为 预测 y 的 “最 终 ” 模 型 存在 的 两 个 问题 : (1) 进行 很 区 次 + 检验, 增加 了 
EDA 工 型 错误 和 一 个 下 型 错误 的 概率 ; (2) 在 最 终 逐 步 回归 模型 中 不 包含 高 阶 ( 如 交互 
项 或 者 平方 项 ) 项 . 


模型 构建 
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补充 应 用 练习 

12.62 建立 汽油 销售 模型 . 当 顾客 用 现金 而 不 是 信 
用 卡 付 账 时 , 很 多 服务 站 会 以 降低 的 价格 提供 自 
助 销售 汽油 . 假定 石油 公司 想 为 它 附 属 站 的 平均 
月 汽油 销售 量 E( y) 作为 提供 的 服务 类 型 ( 只 用 现 
金 、 现 金 或 者 信用 卡 (同样 价格 ) 、 现 金 或 者 信用 卡 
(用 现金 时 较 低 ) ) 的 函数 建 模 . 

a. 需要 多 少 个 虚拟 变量 来 描述 定性 自 变 量 服务 
类 型 ? 

b. SKRR EO) 和 服务 类 型 的 主 效应 模型 ， 描 述 
虚拟 变量 的 编码 . 

12. 63 二 阶 多 项 式 . 为 了 建立 因 变 量 y 和 自 变 量 x 
之 间 的 关系 模型 , 研究 者 对 三 个 不 同 的 x 值得 到 了 
y 的 测量 值 . 凭借 数学 专长 , 研究 者 实现 了 可 能 拟 
合 的 二 阶 多 项 式 模型 : 

E(y) By +Bix +B, 
并 且 精 确 地 通过 所 有 三 个 点 , 得 到 SSE = 0. 研究 者 
为 模型 的 “ 极 好 ” 拟 合 而 高 兴 , 急于 用 它 进行 推断 ， 
在 尝试 推断 时 会 遇 到 什么 问题 ? 

12.64 材料 和 劳务 成 本 . 为 了 得 到 合同 并 且 获 利 ， 
许多 公司 在 一 项 工作 开始 前 必须 准确 地 估计 成 本 ， 
例如 , 供暖 管道 承包 人 可 以 根据 住房 总 面积 及 是 
否 安装 中 央 空 调 来 估计 新 住户 的 成 本 . 

a. 写 一 个 联系 材料 与 劳务 的 平均 成 本 E(y) 和 面积 
以 及 中 央 空 调 变 量 的 主 效应 模型 . 
b. 写 一 个 平均 成 本 作为 同样 两 个 变量 函数 的 完全 

二 阶 模型 . 

- 为 了 确定 二 次 项 对 预测 平均 成 本 是 否 有 用 , 应 
检验 什么 假设 ? 

d. #J c, 承包 者 抽取 了 25 个 近来 工作 的 样本 , 并 
拟 合 完全 二 阶 模型 (b) 和 简化 模型 (a) ,因此 可 
能 要 进行 检验 来 确定 增加 二 阶 模型 的 复杂 性 是 
否 必要 . 下 表 给 出 了 得 到 的 SSE 和 尼 值 ,是否 
有 足够 的 证 据 表明 二 次 项 对 预测 平均 成 本 是 重 
要 的 ? 取 a =0.05. 


o 








- SSE R 
主 效应 8. 548 0. 950 
二 阶 6. 133 0.964 


12.65 运送 交 货 时 间 . 开发 运送 系统 时 必须 考虑 的 
一 个 因素 是 对 顾客 和 卖家 都 有 益 的 交 货 时 间 . 某 
农机 设备 厂 可 以 用 铁路 或 卡车 运输 他 们 的 产品 , 认 
为 二 阶 模型 对 联系 交 货 时 间 和 两 种 运输 方式 的 运 
输 距 离 是 适合 的 . 因此 , 建议 拟 合 下 面 的 模型 ; 


E(y) =Bo +B,x, * By *Bx, + B,x x, +Bsxix, 

其 中 : 

y= 运输 时 间 

x, = 运输 的 路 程 
un P 铁路 

"odo 卡车 

a. 为 了 确定 数据 是 否 表明 二 次 距离 项 在 模型 中 是 
有 用 的 , 即 平均 交 货 时 间 和 距离 之 间 关 系 存在 
弯曲 , 应 该 检验 什么 假设 ? 

b. 为 了 确定 铁路 和 卡车 的 平均 运送 时 间 之 间 是 否 
存在 差异 , 应 该 检验 什么 假设 ? 

c. 考虑 b, 假定 模型 拟 合 交 货 时 间 的 50 个 观测 值 . 
误差 平方 和 是 SSE = 226. 12. 然后 对 同样 的 数据 
拟 合 简化 模型 ; 

E(y) =B, * Bixi * Box 
得 SSE =259. 34. 做 检验 ,确定 数据 是 否 表明 铁 
路 和 卡车 平均 交 货 时 间 存 在 不 同 ， Ba = 
0.05. 


12.66 ”二 氧化 碳 溢 流 试验 . 提炼 原油 最 有 前 景 的 方 


法 之 一 是 用 二 氧化 碳 (C0, ) 溢 流 技术 . 当 CO, WE AX 
石油 容器 时 ,C0, 通过 置换 原油 来 提高 石油 的 回 
收 . 在 一 次 CO, 洪流 过 程 的 微观 研究 中 , 将 流 管 下 
沉 到 装 有 已 知 石油 数量 的 样本 石油 容器 中 (Journal 
of Petroleum Technology, 1982 年 8 H). 往 石油 容器 
E CO, 记录 回收 石油 的 百分率 . 在 三 种 不 同 
的 流动 压力 和 三 种 不 同 倾 角 下 进行 试验 , 下 表 记 
录 了 置换 试验 数据 . 





压力 m(lbyimz) HRS 。 ”石油 回收 百分率 》 — 
1000 0 60. 58 
1000 15 72.72 
1000 30 79.99 
1500 0 66. 83 
1500 15 80. 78 
1500 30 89. 78 
2000 0 69.18 
2000 15 80.31 
2000 30 91.99 


— — l — 
资料 来 源 : Wang, G. C. “Microscopic investigation of CO; 
flooding process. ” Journal of Petroleum Technology , Vol. 34 , 
No. 8, Aug. 1982, p. 1789-1797. 


a. 写 出 联系 石油 回收 百分率 y 与 压力 xi, 倾角 x, 
的 完全 二 阶 模型 . 

b. 以 石油 回收 百分率 y 为 垂直 轴 , 压力 x, 为 水 平 
轴 , 画 出 样本 数据 散 点 图 ; 将 相应 于 倾角 x。 相 
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同 值 的 点 连接 起 来 . 根据 散 点 图 , 完全 二 阶 模型 
是 否 恰当 ? 

c. 用 交互 作用 模型 Y =Po +Bix! t Box, + Bux, + £ 
拟 合 数据 , 给 出 最 小 二 乘 预测 方程 . 

d. 画 出 类 似 于 b 中 的 散 点 图 , 但 是 用 交互 作用 模 
型 的 预测 值 作为 纵 轴 , 比较 这 两 个 图 ,交互 作用 
模型 是 否 提供 了 一 个 恰当 的 拟 合 . 

e. 用 a =0. 05 统计 检验 检查 模型 的 恰当 性 . 

f. 是 否 有 证 据 证 明 压力 x, 和 倾角 x, 之 间 存 在 交互 
作用 ? 用 a =0. 05 检验 . 

12.67 被 动 式 太阳 能 改进 .一座 40 年 房 龄 的 砖 石 复 

式 建筑 物 最 近 接 受 了 包括 具有 绝缘 外 墙 、 热 分 配 

系统 、 防 风暴 的 外 重 窗 和 和 气 闸口 特征 的 被 动 式 太 

阳 能 改进 . 为 了 测量 改进 的 效力 , 建筑 工程 师 监测 

了 在 改进 前 2 年 和 后 2 年 建筑 物 的 冬季 能 量 使 用 . 

工程 师 希 望 利用 这 些 数 据 拟 合 联系 月 能 量 用 量 y 

( 萨 姆 每 个 记 账 日 ) 和 天 气 恶 劣 强度 x, ( ddh/bd) 和 

x, 的 一 个 回归 模型 ， 其 中 

uz Ë 在 改造 前 
” [Lo ”在 改造 后 

. 写 出 E(y) 的 完全 二 阶 模型 . 

. 对 a 中 的 模型 画 等 高 线 . 

c. 假设 一 个 允许 在 不 同 的 天 气 恶劣 强度 水 平 下 改 
进 前 与 改进 后 的 月 平均 用 量 之 间 相 差 一 个 常数 
的 一 阶 模型 . 

d. iti d c 中 模型 的 等 高 线 . 

12.68 公共 运输 系统 研究 . 研究 者 分 析 了 新 墨西哥 

的 阿布 奎 基 公 交 运 输 需求 ,选择 这 个 城市 是 因为 

它 有 唯一 的 多 中 心 “Sun Ta” 公共 运输 系统 

(Transportation Quarterly, 1983 年 1 月 ). 研究 的 一 

个 方面 是 建立 预测 城市 地 区 Sun Tran 小 区 的 家 庭 

473 y (HI 1000 个 居民 中 家 庭 出 行 的 人 数 ) 的 

多 元 回归 模型 . 下 面 是 度量 运输 线路 服务 水 平 ( 运 

输 时 间 ) 的 5 个 自 变 量 , 加 入 模型 作为 主 效应 : 

x, = 到 达 主 要 终点 站 的 混合 车 辆 运输 时 间 (min) 

x, = 运输 线 等 待 时 间 (min) 

x, = 到达 主要 终点 站 要 求 的 转车 次 数 

x, = #E Sun Tran 地 区 服务 的 运输 线路 个 数 

n- Ë 如 果 Sun Tran 小 区 在 主要 地 区 运输 通路 的 终点 

` (0 如果 不 是 
用 从 298 个 Sun Tran 规划 分 析 区 域 收集 的 城市 公 
交 乘 客 调查 数据 来 拟 合 模型 
E(y) =Bo +B,x, +B% * Bax, * Bax, + Bsxs 
得 到 下 面 的 结果 : 


e 


= 


y =22. (2 —0. 18x, —0. 25x, -4 69x; +3. 67x, +22, 52x; 
s=8.65, R 20.593, F =87. 53(p 值 =0. 0001) 

a. 解释 模型 中 每 个 估计 值 . 

b. 解释 R° 值 . 

c. 解释 s 值 . 

d. 这 个 模型 对 于 预测 家 庭 出 行 率 y 是 否 有 用 , 用 
a =0. 05 检验 . 

e. FPEO) ER x, m fl x, BS 3800 32 2 — B 
模型 . 

f. 考虑 e, 给 出 检验 所 有 xs 交互 作用 项 的 简化 
模型 . 








12.69 工作 安全 研究 . 某 公 司 正在 研究 三 种 不 同 的 


安全 方案 A. B 和 C, 试图 减少 因 事故 而 引起 的 工 

时 损失 数 . 每 个 方案 在 公司 9 家 工厂 中 的 3 家 进行 

试验 , 计划 是 监测 在 实施 新 的 安全 方案 后 的 6 个 月 

开始 的 一 年 间 损 失 工 时 数 y. 

a. 写 一 个 联系 Ey) 和 实施 方案 之 前 那 一 年 的 损失 
工时 x, 与 实施 方案 类 型 的 主 效应 模型 . 

b. 利用 a 的 模型 参数 说 明 , 为 了 确定 平均 工时 损 
失 对 于 三 种 安全 方案 是 否 不 同 , 应 检验 什么 
假设 ? 

c. 在 这 三 种 安全 方案 运行 18 个 月 后 , 用 完全 主 效 
应 模型 拟 合 n=9 数据 点 . 以 安全 方案 A 作为 基 
准 水 平 , 得 到 下 面 的 结果 : 

f= -2.1+0. 88x, —150x, + 35x, 
SSE = 1527. 27 
然后 , 拟 合 简化 模型 E(y) =b * Bux, 结果 是 : 
$ 215.3 +0. 84x, SSE =3113. 14 
检验 并 确定 这 三 种 方案 对 平均 工时 损失 是 否 有 
不 同 , 用 o =0. 05. 


12.70 可 燃气 消耗 量 模型 . 能 源 保护 论 者 希望 建立 


一 个 模型 来 估计 美国 平均 年 汽油 消耗 量 y( 百 万 
T), 作为 下 面 两 个 自 变量 的 函数 : 
x, = 一 年 间 使 用 的 轿车 数 ( 百 万 ) 
x = 一 年 闻 使 用 的 卡车 数 ( 百 万 ) 
a. 识别 自 变量 是 定量 的 还 是 定性 的 . 
b. 写 出 Ely) 的 一 阶 模型 . 
e. SSH E(y) 的 完全 二 阶 模型 . 
d. ZJE c 中 的 模型 ,给 出 用 来 检验 存在 x, 和 x 之 
间 交 互 作用 的 原 假设 和 备 择 假 设 . 


12.71 建立 水 中 溶解 氧 模型 . 河川 中 的 溶 氧 量 y 与 


每 升水 中 的 氮 化 物 量 x 、 水 的 温度 z, 有 关 , 写 出 
联系 ECy) Rm , x, 的 完全 二 阶 模型 . 


模型 构建 
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12.72 土豆 产量 试验 . 从 一 个 调查 土豆 产量 y 和 土 
壤 中 三 种 矿物 水 平 x, x,, x, 间 关 系 的 试验 中 得 到 
下 面 的 数据 . (g, 从 每 一 个 x 值 中 减 去 一 个 合适 
的 常数 作为 矿物 水 平 的 编码 . ) 





这 种 灯泡 投入 市 场 . 已 经 知道 灯泡 的 光 输出 水 平 
依赖 于 它 表面 区 域 的 清洁 度 和 灯泡 已 经 使 用 的 时 
间 长 度 , 下 表 给 出 了 数据 , 用 这 些 数据 和 本 章 学 过 
的 方法 建立 一 个 联系 光 输 出 的 下 降 和 灯泡 表面 清 











y m «uml y aj " " 洁 度 以 及 使 用 时 间 长 度 的 回归 模型 . 
1640-1 -1 -1| 2.75. 1 1 1 光 输 出 下 降 灯泡 表面 。 ”使 用 时 间 长 度 
13.51 1 -1 -1|14.33 -1.682 0 0 (原始 输出 的 百分数 )(C = 清洁 ,D = gk) (h) 
14.41 -1 1 -1| 544 1.682 0 0 0 C 0 
9.38 1 1 -1 |19.80 0 -1.682 0 16 C 400 
10.77 -1 -1 1 20.00 0 1.682 0 22 C 800 
11.78 1 -1 11 9.37 0 0 -1.682 27 C 1200 
4.11 -1 1 1 ||10.03 0 0 1. 682 32 C 1600 

36 C 2000 

a. 用 最 小 二 乘法 拟 合 二 阶 多 项 式 模型 38 C 2400 
y =Po t Bis, +B,x; +DBaxa +B4xixa + Bsx xs 0 D 0 

t Boxyxs Bux MET EP 4 D 400 

b. 检验 假设 H, : B, -Bs =…=B=0, 即 检验 这 些 6 D 800 
数据 是 否 提供 了 充分 证 据 表明 对 于 产量 的 预测 ， b i200 

二 阶 模型 比 一 阶 模型 贡献 了 更 多 的 信息 , 利用 ; b w. 

a =0. 05 检验 . 

. 11 D 2000 
12.73 B Atri. 某 公司 已 经 开发 了 一 种 新 型 12 D 2400 


KIRARIM, 并 且 想 通过 性 能 评估 来 决定 是 否 把 


活动 中 的 统计 学 :取消 州 内 货车 运输 业 限制 

我 们 用 一 个 工程 经 济 学 的 实际 研究 来 说 明 本 章 给 出 的 建 模 方法 . 考虑 建立 某 个 州 汽车 运输 服务 
(如 货车 运输 ) 的 收费 价格 模型 , 在 20 世纪 80 年 代 前 期 , 几 个 州 取消 了 州 内 货车 运输 服务 收费 率 的 
强制 性 限制 (佛罗里达 州 在 1980 年 7 月 1 日 第 一 个 取消 该 政策 ). 回归 分 析 的 一 个 日 的 是 评 佑 州 取消 
限制 对 按 每 吨 - 英里 支付 供应 价格 的 影响 . 

TRUCKING 文件 中 保存 了 佛罗里达 某 运 输入 员 的 134 个 货运 数据 . 感 兴 趣 的 因 变量 y 是 每 吨 - 
”英里 收费 的 自然 对 数 .. 一 个 包括 逐步 回归 的 谨慎 变 量 筛选 过 程 用 来 确定 哪些 自 变量 是 供应 价格 的 
“最 好 "预测 变量 . 图 SIA12. 1 给 出 了 SAS 逐步 回归 输出 结果 ， 这 个 分 析 使 我 们 选择 下 面 的 变量 开始 
建立 模型 过 程 . 

1. 运输 距离 ( 百 英里 ). 

2. 运输 的 货物 重量 (klb). 








Summary of Stepwise Select ion 


Var iable 
Btep Entered 


Variable Number 
Removed 


Partial Model 


Vars In R-Square R-Square C(p) F Value Pr > F 





1 DISTANCE 1 0.2953 0.2969 417.090 55.74 <.0001 
2 DEREG 2 0.3127 0.6096 175.795 194.91 <. 0001 
3 HE IGHT 3 0.1897 0.7993 30.1997 122.84 «.0001 
4 DRIGIN 4 0.0362 0.8355 4.0122 28.40 €.0001 








图 SIA12. 1 SAS 逐步 回归 输出 的 一 部 分 
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3. 取消 限制 的 影响 (有 或 者 没有 ). 
4. 运送 的 起 点 (迈阿密 或 者 杰克 撑 维尔 ). 
运输 距离 和 货物 重量 是 定量 变量 , 因为 它们 可 能 取 的 数值 (分 别 为 英里 和 磅 ) 相 应 于 直线 上 的 
点 . 取消 限制 和 出 发 地 是 定性 的 或 者 是 类 型 变量 , 必须 用 虚拟 (或 者 编码 ) 变量 表示 . 给 定 的 变量 赋 
值 如 下 : 
x, = 运输 距离 
x, = 货物 重量 
_ [1 ”如 果 取 消 限制 有 影响 
57 lo 如 果 没 有 
_ [1 ”如 果 从 迈阿密 出 发 
un lo 如 果 从 杰克 逊 维尔 出 发 
注意 ,在 定义 虚拟 变量 时 ,分 别 任意 选择 “没有 ”和 “杰克逊 维尔 "作为 取消 限制 和 出 发 地 的 基准 
水 平 . 
我 们 由 指定 4 个 模型 开始 建 模 过 程 . 这 些 模型 称 为 异型 1 ~4, 在 表 SIA12. 1 中 给 出 . 注意 模型 1 
是 完全 二 阶 模型 . 回想 12.7 节 , 完全 二 阶 模型 包括 定量 变量 的 二 阶 (曲率 ) 项 与 定量 和 定性 变量 之 间 
的 交互 作用 项 . 对 于 运输 数据 , 模型 1 描述 了 价格 自然 对 数 的 平均 EC) 作为 距离 (xz ) 和 重量 (%, ) 的 
范 数 的 抛物 面 , 对 取消 限制 (zs ) 和 出 发 地 (%4 ) 水 平 的 2 x2 =4 种 组 合 , 这 些 响应 曲面 是 不 同 的 . — 
般 地 ,完全 二 阶 模型 在 开始 建 模 过 程 中 处 于 好 的 地 位 ,因为 变量 间 最 真实 关系 是 曲线 的 . (但 是 请 记 
FE, 必须 有 足够 多 的 数据 点 来 估计 模型 里 的 所 有 参数 . ) 利用 SAS 用 模型 1 拟 合 TRUCKING 文件 中 
134 个 装运 货物 数据 ,图 SIA12. 2 给 出 了 结果 . 注意 全 模型 下 检验 的 bp 值 小 于 0. 0001 表明 完全 二 阶 
模型 对 于 预测 货车 运输 价格 是 统计 有 用 的 . l 


R SIA12. 1 ”货运 价格 自然 对 数 的 假设 模型 


2 2 
模型 1: E(y) 7o + Bixi Box, + Bsxix2 + Baxi + Bsz2 + ox + Bx, + Bax,  Boxixs + Dio xi xs + Bui xyx3xa + By Xaxy 


2 2 2 2 
+Bi3x2%4 +Bia Xax3X4 + Bis xi xox, + Bis Xix534 + Biy x1x2%3x4 + Big 3123 + Bio xix, + oo xi xaxa oa X534 





+ Ba xyx, + B23x2x3x4 

模型 2: E(y) = Bo *Bix + Box, + Bsziz, + Bax, + Bixa + Bexsxa + Boxix3 + Big 2154 + Bii x1x3%4 + Bi 2255 + B13 X254 
*Busyxyx, + B isz1z2%3 Bex xo + By x 22 X3 4 

模型 3: E(y) 2B, +Bix1 * By, t Bax x, e Bax; * Bs * Bsxs * Boxa + Baxaxa 

模型 4: E(y) =po *tBin * By, + Bsxix Bax; +B; * Bots + Bx, + Baxaxa + Box 25 + Bio9ix, + By xxx, + B12 xx 
* Bios +Biax2x3%4 + B) sx 12223 * Bii 3x4 + Brr% xo x4 x4 

模型 5: E(y) =Bo * Bix, * Box, * Bax, x; +B, +Bsx2 + Box + Box xs +Bi2x22s + Bs 2233 

模型 6: E(y) - B *tBy ct [yxs t Baix, e Bax + sx) * Box * Bio sa + Pr3x2x4 + Big 5x4 


2 2 
模型 7: E(y) 7o * Bixi t Box; + Byzi x, + Bax + Bs35 + Bex3 Bx, + Boxx + Bioxi%4 + Bi xx By xx. + fissi xus, 


+ Big, 3x4 


”模型 2 包含 了 模型 1 中 除了 二 阶 项 ( 即 包含 好 a2 的 项 ) 以 外 的 所 有 项 . 这 个 模型 对 取消 限制 
和 出 发 地 的 水 平 组 合 也 具有 4 个 不 同 的 响应 曲面 , 但 响 曲 应 面 是 挠 曲面 ( 见 图 12. 10) 而 不 是 抛物 面 . 
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Dependent Variable: LNPRICE 
finalysis of Variance 
Sum of Mean 
Source DF Squares Square F Value Pr »F 
Model 23 83.90934 3.64823 65.59 <.0001 
Error 110 .6.11860 0.05562 
Corrected Total 133 90.02794 
Root MSE 0.23585 R-Square 0.9320 
Dependent Mean 10.57621 fidj R-Sq 0.9178 
Coeff Var 2.22997 
à Parameter Estimates 
Parameter Standard 
Variable DF Estimate Error t Value Pr > it! 
Intercept 1 12.51593 0.95441 13.11 €«.0001 
X1 1 -0.89923 0.73410 -1.22 0.2232 
x2 1 0.02421 0.02886 0.84 0.4034 
XIX2 1 -0.02071 0.00573 -3.08 0.00265 
X150 1 0.15145 0.13455 1.13 0.2628 
x250 1 -0.00010196 0.00076963 -0.13 0.8948 
x3 1 -1.12650 1.49104 -0.76 0.4516 
X4 1 0.27615 0.96332 0.29 0.7749 
X3X4 1 0.496937 1.50290 0.33 0.7415 
X1X3 1 0.48205 1.15882 0.42 0.5782 
X1X4 1 0.06958 0.73882 0.03 0.9251 
XI1X3X4 1 -0.54037 1.16440 -0.46 0.6435 
X2X3 1 -0.09486 0.04477 -2.12 0.0363 
X2X4 1 -0.05261 0.03528 -1.49 0.1387 
X2X3X4 1 0.06826 0.05220 1.31 0.1937 
X1X2X3 1 0.02207 0.01078 2.05 0.0429 
X1X2X4 1 0.02355 0.00709 3.32 0.0012 
XIX2X3X4 1 -0.02694 0.01127 -2.39 0.0185 
X15S0X3 1 -0.11674 0.21918 -0.53 0.5954 
X180X4 1 -0.07276 0.13510 -0.54 0.5913 
X180X3X4 1 0.13424 0.21984 0.61 0.5427 
X280X3 1 0.00043756 0.00119 0.37 0.7127 
X28B]X4 1 0.00011095 0.00107 0.10 0.9174 
X280X3X4 1 -0.00027597 0.00157 -0.18 0.8609 








图 SIA12.2 模型 1 的 SAS 回归 输出 


直接 比较 模型 1 和 2 允许 检验 弯曲 项 的 重要 性 . 

模型 3 包含 了 模型 1 除了 定量 -定性 交互 作用 项 以 外 的 所 有 项 ,相应 于 4 种 取消 限制 - 出 发 地 
组 合 , 这 个 模型 有 4 个 仅 关 于 y 截 距 不 同 的 抛物 面 . 直接 比较 模型 1 和 模型 3, 我 们 可 以 检验 所 有 定 
量 -定性 交互 作用 项 的 重要 性 . 

”模型 4 和 模型 1 一 样 ， 除了 它 不 含有 二 阶 项 和 两 个 定性 变量 取消 限制 (x ) ， 出 发 地 (x ) 之 间 的 
交互 作用 项 . 尽管 模型 包含 弯曲 ， 但 距离 (xl ) 和 重量 (x, ) 的 曲率 在 所 有 取消 限制 和 出 发 地 的 水 平 是 
相同 的 . 

图 SIA12. 3 给 出 了 前 段 描 述 的 舱 套 模型 检验 的 结果 , 这 些 检 验 总 结 如 下 ， 
检验 所 有 二 阶 项 的 显著 性 (模型 1 对 模型 2) | 

Ho: B4 - Bs 7 Big - Bio =B% =P, 7B» 3-0 

H,: 在 模型 1 中 至 少 有 一 个 二 阶 项 B 不 为 0 
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F -13. 61, p fË «0. 0001 ( ÆI SIA12. 3 顶部 的 阴影 部 分 ) 


结论 : 有 充分 的 证 据 表明 (在 a 20.01) , E(y) 和 距离 x, ER n 之 间 的 关系 是 曲线 的 . 作为 货 
物 运 输 价格 的 预测 式 , 模型 1 比 模型 2 在 统计 意义 上 更 好 . 


Test QUADRATIC Results for Dependent Variable LNPRICE 





Mean 
Source DF Square F Value Pr >F 
Numerator 8 0.75727 13.61 «.0001 
Denon inator 110 0.05562 


Test QN QL INTERACT Results for 
Dependent Variable LNPRICE 


Mean 
Source DF Square F Value Pr >F 
Numerator 15 0.25574 4.60 <.0001 
Denominator 110 0.05562 


Test QL QUAD INTERACT Results 
Ë for Dependent Variable LNPRICE 





Mean 
Source DF Square F Value Pr > F 
Numerator 6 0.01407 0.25 0.9572 
Denominator 110 0.05562 








图 SIA12.3 ”对 模型 1 中 项 SAS BURECAEBUS 尺 检 验 


检验 所 有 定量 一 定性 交互 作用 项 的 显著 性 (模型 1 对 模型 3) 
Ho Bo =Bio 7 Bii 7 Bio 7 Bis =Bi4 =Bis 7 Bis =B17 =Big =Bio =B>o = B31 7 Bz; = B5 =0 
H,; 模型 1 中 QN x QL 交互 作用 项 8 中 至 少 有 一 个 不 为 0. 
F -4. 60, p fH «0. 0001( Æ SIA12.3 中 部 的 阴影 部 分 . ) 
结论 : 有 充分 的 证 据 ( 在 o =0. 01) 表 明和 定量 变量 (QN) 距 离 (x; ) 和 重量 (zx ) 与 定性 变量 ( QL.) 取 


消 限制 (xs ) 和 出 发 地 (x4 ) 之 间 存 在 交互 作用 . 作为 货车 运输 价格 的 预测 式 ， 模型 1 在 统计 意义 上 比 
模型 3 更 好 . 


定性 二 阶 交互 作用 项 的 显著 性 检验 (模型 1 对 模型 4) 
Ho : Bis 2 Bio =B% = B> =B2 =B23 =0 
H,: 模型 1 中 至 少 有 一 个 定性 二 阶 交互 作用 项 的 86 不 为 0. 
, F=0.25, p fË =0.9572( 图 SIA12. 3 底部 的 阴影 部 分 . ) 
结论 : 没有 充分 的 证 据 (在 a=0.01) 表 明 距 离 (x ) 和 重量 (%, ) 的 二 次 项 与 定性 变量 取消 限制 
(x3)、 出 发 地 (x4 ) 之 间 存 在 交互 作用 . ou usun 我 们 从 模型 1 中 删 去 这 些 项 , 并 
推断 模型 4 是 货 物 运输 价格 统计 上 较 好 的 预测 量 








O ”从 模型 里 删 去 项 总 是 有 风险 的 . 本 质 上 , 当 P( RRR) =P( 当 有 不 真 时 候 接 受 Hy) =B 未 知 时 , 接受 假设 H, = 
Bis 7i =u 7:5 = 0. 但 是 在 实际 上 ， 当 有 一 个 简单 的 且 与 预测 量 几乎 一 一 样 好 ( 且 易 于 应 用 和 解释 ) 的 模型 时 ， 很 
多 研究 者 愿意 冒 着 犯 第 二 类 错误 的 风险 , 对 E) 用 一 个 比较 复杂 的 模型 . 注意 到 我 们 用 了 一 个 相对 较 大 的 数据 量 


(n=134) 拟 合 模型 , 并 且 模 型 4 的 RT 确实 大 于 模型 1 的 R2. 如 果 事 实 上 一 阶 交互 作用 项 是 重要 的 ( 即 我 们 犯 了 第 二 
类 错误 ) , 那么 在 用 模型 4 解释 变异 性 时 会 有 一 点 损失 . 
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根据 三 个 柑 套 模型 户 检 验 , 发 现 模型 4 在 前 4 个 模型 中 是 “最 好 的 ”. 图 SIA12.4 给 出 了 模型 4 的 
SAS 输出 . 考虑 整体 下 检验 的 结果 (P 值 小 于 0.0001), 可 以 看 到 整体 模型 在 统计 意义 上 对 运输 价格 的 预 
测 是 有 用 的 . 另外 ,Rs =0. 9210 意味 着 大 约 9206 的 货车 运输 价格 自然 对 数 的 样本 变异 可 以 用 模型 解释 . 
尽管 这 些 模 型 统计 量 给 人 印象 深刻 , 但 是 可 以 找 出 一 个 更 简单 的 模型 来 同样 很 好 地 拟 合 数 据 . 

K SIA12. 1 给 出 了 另外 三 个 模型 . 模型 5 和 模型 4 一样, 但 是 删 去 了 定性 变量 出 发 地 x, 的 所 
有 项 .比较 模型 4 和 模型 5， 可 以 确定 出 发 地 是 否 真 的 对 货车 运送 价格 有 影响 . 类 似 地 , 模型 6 和 
模型 4 一 样 , 但 已 经 删 去 关于 定性 变量 取消 限制 (xs ) 的 所 有 项 . 比较 模型 4 和 模型 6, 可 以 确定 取 
消 限制 是 否 对 货物 运输 价格 有 影响 . 最 后 , 我 们 提出 删除 所 有 定性 -定性 交互 作用 项 而 得 的 模型 
7. 模型 4 和 模型 7 的 比较 使 我 们 看 到 了 取消 限制 和 出 发 地 的 交互 作用 影响 了 货物 运输 价格 的 自 
然 对 数 . 











Dependent Var iable: LNPRICE 
ñnalysis of Var iance 
Sum of Mean 
Source DF Squares Square F Value Pr >F 
Model 17 83.82435 4.93088 92.21 <.0001 
Error 116 6.20299 0.05347 
Corrected Total 133 90.02794 
Root MSE 0.23124 R-Square 0.9311 
Dependent Mean 10.57621 fidj R-8q 0.9210 
Coeff Var 2.18646 
Parameter Estimates 
R Parameter Standard 
Variable DF Estimate Error t Value Pr > iti 
Intercept 1 12.08482 0.25871 46.71 <.0001 
XI 1 -0.55296 0.09648 -5.73 <.0001 
x2 1 0.01889 0.02120 0.89 0.3748 
X1X2 1 -0.02041 0.00549 -3.15 0.0021 
X180 1 0.08738 0.00827 10.56 «.0001 
X25 1 0.00008202 0.00037354 0.22 0.8266 
x3 1 -0.38504 0.40009 -0.96 0.3379 
X4 1 0.76041 0.27135 2.80 0.0059 
X3X4 1 -0.35311 0.42651 -0.83 0.4095 
X1X3 1 -0.13163 0.14172 -0.93 0.3549 
X1X4 1 -0.33374 0.08995 -3.71 0.0003 
X1X3X4 1 0.18215 0.14745 1.24 0.2192 
X2X3 1 -0.08259 0.02956 -2.79 0.0061 
X2X4 1 -0.04830 0.02049 -2.36 0.0201 
X2X3X4 1 0.05337 0.03217 1.85 0.0675 
X1X2X3 1 0.02136 0.01043 2.05 0.0428 
X1X2X4 1 0.02320 0.00685 3.39 0.0010 
X1X2X3X4 、 1 -0.02601 0.01090 -2.39 0.0186 





图 SIA12.4 模型 4 的 SAS 回归 输出 结果 


图 SIA12. 5 给 出 了 上 述 嵌 套 模型 下 检验 的 结果 . 对 每 个 检验 总 结 如 下 

检验 所 有 出 发 地 项 的 显著 性 (模型 4 对 模型 5) 

Ho: B; - Bs =Bio 2 Bii =Bis 2 By =Bis =B1y =0 

H,; 模型 4 中 至 少 有 一 项 出 发 地 的 6 不 等 于 0 

上 =3.5$,p 值 =0.001 (图 SIA12. 5 顶部 的 阴影 部 分 ) 

结论 : 有 充分 的 证 据 (在 =0.01) 表 明 出 发 地 (zx ) 对 货物 运输 价格 有 影响 . 在 预测 货物 运输 价 
格 时 , 模型 4 在 统计 意义 上 比 模型 5 好 . 
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检验 所 有 取消 限制 项 的 显著 性 (模型 4 对 模型 6) 

Hy: Be - Ba 2 Bo =Bu - Bi =Bu 7 Bis - y; =0 

H,; 模型 4 中 至 少 有 一 项 取消 限制 的 B 不 等 于 0 

F =75. 44, p fÈ <0. 0001 ( Æ| SIA12. 5 中 部 的 阴影 部 分 ) 


Test UHIUIN Hesults for Dependent Variable 





Mean 
Source DF Square E Value Pr > F 
Numerator 8 0.18987 3.55. 0.001 
Denon inator 116 0.05347 


Test DEREG Results for Dependent Variable L 


Mean 
Source DF Square F Value Pr >F 
Numerator 8 4.03417 75.44 <0.0001 
Denon inator 116 0.05347 


Test ORG DEREG INTERACT ION Results 
for Dependent Variable LNPRICE 


Mean 








Source DF Square Ë Value Pr >F 
Nunerator 4 0.11357? 2.13 0.0821 
Denominator 116 0.05347 





图 SIA12.5 模型 4 中 项 的 SAS WEE F 检验 


结论 : 有 充分 的 证 据 ( 在 a =0. 01) 表 明 取 消 限 制 (xs ) 对 货物 运输 价格 有 影响 . 在 预测 货物 运输 
价格 时 , 模型 4 在 统计 上 比 模型 6 要 好 . 

检验 所 有 取消 限制 - 出 发 地 交互 作用 项 的 显著 性 (模型 4 对 模型 7) 

Ho: Bs Bi - By, =B =0 

H,; 模型 4 中 至 少 有 一 次 QL x QL 交互 作用 项 B 不 等 于 0 

F -2.13, p {Ë =0.0820( E] SIA12. 5 的 底部 的 阴影 部 分 ) 

结论 : 没有 充分 的 证 据 (在 a =0. 01) 表 明 取 消 限 制 (x3) 和 出 发 地 (x ) 有 交互 作用 . 因此 , 我 们 
从 模型 4 中 删 去 这 些 交 互 作用 项 , 断言 模型 7 是 货物 运输 价格 的 在 统计 意义 上 更 好 的 预测 模型 . 

AZ, WERN 尺 检 验 建议 模型 7 是 货物 运输 价格 自然 对 数 的 最 佳 模型 . 图 SIA12. 6 给 出 了 模 
型 7 的 SAS 输出 ， 用 于 预测 货物 运输 价格 的 6 估计 值 在 输出 中 着 重 显示 . 

警告 : 就 像 单个 B 参数 的 了 检验 一 样 ， 应 该 避免 做 太 多 的 部 分 下 检验 . 不 管 检验 类 型 (1 AAA, F 
检验 ) ,进行 的 检验 越 多 , 整体] 型 错误 率 将 越 高 . 实际 中 ,应 该 限制 提议 作为 E(y) 的 模型 个 数 ， 使 
得 对 所 进行 的 部 分 已 检验 的 整体 T 型 错误 率 o 保持 合理 小 的 值 G 





s 所 各 多 尼 提 出 的 方法 经 常用 于 保持 对 整体 T 型 错 误 率 a 的 控制. 如 果 进 行 次 检验 , 那么 在 显著 性 水 平 we Fig 
一 次 检验 , 这 可 以 保证 整体 了 型 错误 率 小 于 或 等 于 o. iin, 进行 。=5 次 检验 的 每 一 次 都 在 0.05/5 =0. 01 显著 性 水 平 
F, 可 以 保证 整体 as 0. 05. 
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Source DF 
Model 13 
Error 120 
Corrected Total 133 
Root MSE 
Dependent Mean 
Coeff Var 


Variable DF 





— —— — et — — — eh — md amd — — 








finalysis of W 


Sum of 
Squares 


83.37026 


6.65767 
90.02794 


0.23554 
10.57621 
2.22710 


Parameter Esti 


s 


0.0 








图 SIA12.6 模型 7 的 SAS 回归 输出 





Dependent Variable: LNPRICE 


0. 
0. 


ar iance 
Mean 
Square 
6.41310 
0.05548 
R-Square 
fidj R-Sq 
nates 
tandard 
Error t Value 
0.21583 55.49 
0.08425 -7.10 
0.01857 -0.32 
0.00530 -2.03 
0.00834 10.28 
0037728 0.38 
0.12900 -6.06 
0.21035 3.22 
0.03999 1.00 
0.07267 -3.78 
0.01045 -2.00 
0.01610 -1.63 
0.00303 -1.10 
0.00544 2.39 





F Value 


115.59 


9260 
9180 


Pr > 


cooocooo^o^noo^^ 


iti 


.0001 
.0001 
.7480 
.0442 
.0001 
. 7072 
.0001 
.0017 
.3203 
.0002 
.0473 
. 1063 
. 2757 
.0186 


Pr > F 
<.0001 
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第 13 章 试验 设计 的 原理 


目标 简要 介绍 比较 两 个 或 多 个 总 体 均 值 的 试验 设计 ;解释 试验 设计 的 统计 原理 . 
13.1 引言 


在 第 11 ~12 章 , 我 们 学 习 了 怎样 用 多 元 回归 分 析 来 分 析 多 元 样本 数据 . 用 于 回归 的 数据 可 以 用 
观测 方法 采集 (在 自 变量 的 自然 环境 下 观测 它们 的 值 ) 或 者 试验 方法 采集 (控制 x 取 值 ， 即 事先 设 
AE). 但 是 ,对 于 观测 数据 有 一 个 警告 ; 响应 y 和 预测 值 x 之 间 的 统计 上 显著 关系 不 一 定 意味 着 具有 
ARXA! 因为 其 他 有 关 的 自 变量 (在 模型 中 和 从 模型 中 删除 的 ) 是 不 受 控制 的 ,我 们 不 能 确定 是 那 
些 其 他 变量 还 是 x 引起 了 y 的 增加 (或 减少 ). 

运输 部 门 的 工程 师 想 为 一 条 公路 的 合同 价格 y 建 模 , 这 个 价格 由 竞拍 过 程 中 的 最 低 竞 标 者 来 决 
AE. 假定 工程 师 发 现 竞标 者 的 人 数 x, 以 一 阶 模型 E(y) =Po *tBix 与 yY 负 相关 , 且 这 个 关系 是 统计 上 
显著 的 , 这 是 否 意味 着 , 竞标 公路 合同 的 承包 人 越 少 ， 合同 价格 就 总 是 越 高 ? 未 必 如 此 . 工程 师 对 于 
竞标 过 程 的 了 解 表明 有 较 多 的 承包 者 想 竞 标 更 长 的 公路 ,因此 ， 长 公路 合同 的 低 竞 标价 格 明显 地 比 
短 公 路 合同 的 低 竞 标价 格 高 . 换 句 话说 ,一 个 未 测量 的 变量 (公路 长 度 ) 导 至 y 和 x 的 变化 . 

可 以 用 一 个 设计 的 试验 来 控制 所 有 相关 的 x 值 , 以 克服 上 面 的 问题 对 试验 数据 , 我 们 通常 选择 
这 样 的 x, 以 比较 x 值 的 几 个 不 同 组 合 的 平均 响应 E y). 

事先 选择 样本 数据 z 集合 的 过 程 称 为 试验 设计 ， 比较 总 体 均值 的 统计 过 程 称 为 方差 分 析 . 本 章 目 
的 是 介绍 试验 设计 的 几 个 关键 概念 ， 用 方差 分 析 来 分 析 这 种 试验 数据 是 第 14 章 主要 讨论 的 内 容 . 


13.2 试验 设计 术语 


早 在 20 世纪 初 , 英格兰 的 费 希 尔 开始 研究 试验 设计 . 在 最 初 几 年 , 试验 设计 只 与 农业 试验 相关 . 
农业 对 试验 设计 的 需求 非常 清楚 ， 为 了 得 到 大 部 分 农作物 新 品种 产量 的 一 个 观测 值 ， 需 花 费 整 一 年 
的 时 间 . 因此 , 为 了 节省 时 间 和 花费 ， 产生 了 利用 较 小 样本 得 到 更 多 信息 的 方法 研究 . 类 似 的 动机 使 
它 在 所 有 科学 试验 领域 中 得 到 了 接受 和 广泛 的 应 用 ， 除 此 之 外 , 与 试验 设计 相关 的 术语 清楚 地 表明 
它 早 期 与 生物 科学 的 关系 . 

我 们 把 收集 样本 数据 的 过 程 称 作 试 验 ; 把 要 测量 的 ( 因 ) 变量 称 作 响应 y; 抽样 过 程 的 计划 称 作 
试验 设计 ; 用 来 测量 响应 y 的 对 象 称 作 试验 单位 . 

xE X. 13.1 收集 样本 数据 的 过 程 称 作 试 验 . 

定义 13.2 收集 样本 的 计划 称 作 试验 设计 . 

定义 13.3 试验 中 测量 的 变量 称 作 响 应 变量 . 

定义 13.4 用 来 测量 响应 y 的 对 象 称 作 试验 单位 . 

与 响应 变量 y 可 能 有 联系 的 自 变量 称 作 因子 ; 在 一 次 试验 中 因子 的 可 能 取 值 ( 即 设 定 的 强度 ) 称 
作 水 平 ; 观测 响应 的 因子 组 合 水 平 称 作 处 理 . 

定义 13.5 与 响应 变量 y 联系 的 定量 或 者 定性 自 变量 称 作 因 子 . 

定义 13.6 因子 强度 的 设置 ( 即 试验 中 因子 的 可 能 取 值 ) 称 作 水 平 . 
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定义 13.7 处理 是 一 次 试验 中 包含 的 因子 水 平 的 某 种 组 合 . 
做 试验 ,确定 压强 和 温度 对 一 种 新 型 塑料 硬度 的 影响 , 这 里 硬度 以 标 度 1( 非 常 软 ) 到 10 
(非常 硬 ) 来 分 级 . 在 浇铸 的 时 候 , 压强 设 定 为 200 , 300 或 400 Ib/in2 ,温度 设 定 为 200 或 者 300 下 . 三 



























种 塑料 铸 型 随机 指派 给 3 x2 =6 种 压强 和 温度 组 合 压强 
的 每 一 个 ,测量 每 个 铸 型 的 硬度 等 级 . 图 13.1 给 出 | | aoin | aont? | 400myi | 
|o I| | 中 

了 设计 的 安排 , 对 于 这 个 试验 ,指出 UT [uso lumus umo 
a. 试验 单位 . 湿度 铸 型 14 | 铺 型 16 | 铸 型 17 
b. 响应 y. 300°F 铸 型 5 铸 型 6 
c. 因子 . 铸 型 10 铸 型 11 
d. AFKE. 铸 型 13 铸 型 15 
e. 处 理 . 
s 图 13.1 例 13.1 设计 的 试验 安排 


a. 因为 是 对 18 种 塑料 铸 型 进行 测量 , 所 以 试验 单位 是 塑料 铸 型 . 

b. 感 兴趣 的 响应 变量 ( 即 在 随机 指派 铸 型 后 测量 的 变量 ) 是 y= 塑料 硬度 水 平 ,注意 y 是 一 个 定 
量变 量 . 对 于 在 此 主题 下 研究 的 设计 类 型 ， 响 应 总 是 定量 变量 . 

c. 因为 试验 的 目的 是 研究 压强 和 温度 对 塑料 硬度 的 影响 , 所 以 压强 和 温度 是 因子 . 

d. 对 于 这 个 试验 , 压强 有 三 个 水 平 (200、300 #l4001b/in2) , WEA AKE (200 FA 300 °F). 

e. 处 理 是 因子 水 平 组 合 , 对 于 这 个 试验 , 有 3 x2 =6 个 处 理 , 或 者 压强 - 温度 组 合 , 如 图 13.1 
所 示 : (2001b/in2, 2007F ) , (2001b/in2, 300°F). (3001b/in2, 200 °F). (3001b/in2, 300°). (4001b/ 
in? , 200 F ) si (400Ib/in? , 300 °F). 

现在 了 解 的 这 些 术 语 有 助 于 理解 试验 设计 的 4 个 步骤 . 





步骤 1 


步骤 2 
步骤 3 
步骤 4 





设计 一 个 试验 的 步骤 
选择 要 进行 试验 的 因子 ， 指 出 作为 研究 对 象 的 参数 . 目标 参数 通常 是 与 因子 水 平 组 合 ( 即 处 
理 ) 相 关联 的 总 体 均值. 
选择 处 理 ( 试 验 所 包含 的 因子 水 平 组 合 ). 
决定 对 每 个 处 理 的 观测 次 数 (样本 容量 ). (这 通常 依赖 于 想 要 得 到 的 标准 误差 . ) 
计划 如 何 将 处 理 指 派 给 试验 单位 . 即 决定 用 哪 种 设计 . 














通过 这 几 个 步 又, 可 以 控制 试验 中 的 信息 量 , 13.3 节 中 将 会 解释 具体 的 做 法 . 
13.3 控制 试验 中 的 信息 


获取 好 的 试验 数据 的 问题 与 通信 工程 师 所 面 对 的 问题 相似 . 任何 信号 、 语 言 或 者 其 他 的 接收 莉 
依赖 于 信号 容量 和 基础 噪音 的 大 小 . 信号 容量 越 大 , 传递 给 接收 者 的 信息 量 越 大 ; 相反 ， 当 基础 噪音 
增 大 时 ,传递 的 信息 容量 将 减少 . 以 下 事实 支持 有 关 影 响 试验 信息 因子 的 直观 想法 : 大 多 数目 标 参 
数 估 计量 的 标准 误差 与 o( 数 据 变异 性 或 者 噪音 的 度量 ) 成 正比 , 与 样本 容量 (信号 容量 的 度量 ) 成 反 
比 . 为 了 说 明 这 一 点 ， 考 虑 用 样本 均值 7 估计 总 体 均值 w 的 简单 情况 . 7 的 抽样 分 布 的 标准 误差 是 : 


= = (参看 6. 9 节 ) 
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对 固定 的 样本 容量 n, 度量 测量 值 总 体 变异 性 (噪音 ) 的 o 值 越 小 , 标准 误差 07 也 越 小 . 类 似 地 , 在 
一 个 给 定 的 试验 里 增 大 样本 容量 n( 信号 容量 ) , 可 以 减 小 05. 

在 试验 设计 的 前 三 个 步骤 中 (选择 因子 和 包含 在 试验 中 的 处 理 ， 指定 样本 容量 ) 决 定 了 信号 容 
TR. 必须 选择 y 的 观测 值 能 对 感 兴趣 参数 提供 信息 的 处 理 . 那么 处 理 样 本 的 容量 越 大 , 试验 的 信息 量 
就 越 大 . 在 13.5 节 , 我 们 给 出 一 个 增 量 试验 的 例子 . 

是 否 有 可 能 观测 y 却 得 不 到 感 兴趣 参数 的 信息 ? 答案 是 肯定 的 . 为 了 说 明 这 个 问题 , 假定 想 用 
如 下 的 一 阶 模型 来 拟 合 n=10 个 数据 点 的 集合 

E(y) =Bo * Bix 

其 中 所 有 观测 都 是 在 一 个 x 值 (如 x=5) 得 到 的 ,数据 点 可 能 如 图 13. 2 所 示 . 可 以 清楚 地 看 到 , 用 一 
条 直线 拟 合 这 些 数据 点 是 不 可 能 的 , 得 到 B, Tug, 信息 的 唯一 方法 > 


是 对 不 同 的 x 值 观测 y, 因此 , 这 个 例子 中 的 n=10 个 数据 点 绝对 没 | 
有 包含 参数 Bo ME 的 信息 . 
试验 设计 中 的 第 4 步 提供 了 减少 试验 中 噪声 (或 者 试验 误差 ) 的 
机 会 . 正如 我 们 将 在 13.4 节 中 说 明 的 , 可 以 通过 分 区 ( 即 在 试验 材 二 一 — 





料 相对 同 质 的 区 组 中 观测 所 有 的 处 理 ) 来 减少 或 者 消去 数据 变异 性 
的 忆 知 来 源 , 在 比较 每 一 个 区 组 中 的 处 理 时 ， 忽 略 或 者 除去 任何 由 。 图 13.2 所 有 在 *=5 时 ， 
这 个 区 组 产生 的 基础 噪声 ,可 得 到 处 理 差异 的 更 好 估计 . n =10 个 响应 的 数据 集 





试验 设计 步骤 汇总 
增加 容量 : 1. 选择 因子 . 
2. 选择 处 理 ( 因子 水 平 组 合 ). 
3. 确定 每 个 处 理 的 样本 容量 . 
减少 干扰 : 4. 给 试验 单位 指派 处 理 . 














总 之 ， 把 试验 设计 考虑 成 “噪声 缩减 器 "或 者 “容量 增 大 器 "是 有 用 的 . 但 是 , 我 们 将 看 到 大 多 数 
试验 设计 是 多 功能 的 , 即 它们 趋向 于 既 减 小 噪声 同时 也 增加 信和 号 容量 . 然而 , 我 们 也 将 发 现 特殊 的 设 
计 是 偏重 于 这 个 或 者 另 一 个 目的 . 

13.4 ”减少 噪声 的 设计 


在 试验 设计 里 减少 干扰 ( 即 消 去 外 部 试验 变异 ) 可 以 通过 为 试验 单位 合理 地 指派 处 理 来 实现 . 其 
思想 是 在 相对 同 质 的 试验 单位 区 组 里 比较 处 理 , 这 种 。 表 13.1 p=3 个 处 理 的 完全 随机 化 设计 











最 常见 的 类 型 称 作 随机 化 区 组 设计 . 工人 ”指派 的 处 理 || 工人 ”指派 的 处 理 
为 了 说 明 ,假定 比较 用 三 种 不 同 装配 方法 (A、B、 — 0n | L Oni) 

C) 装配 一 只 数字 电子 表 所 需要 的 平均 时 间 ,因此 要 比 2 和 |. ^ 

较 三 个 均值 wA, jp, pc ,这 里 ji 是 方法 i 的 平均 装配 3 B Ju c 
时 间 . 设计 这 个 试验 的 一 种 方法 是 选择 15 个 工人 (这 4 C 2 A 
星 工人 是 试验 单位 )， 随 机 指派 三 种 装配 方法 (处 理 ) 5 $ | 5 P 

之 一 给 每 个 工人 . 表 13.1 给 出 了 这 种 称 作 完全 随机 化 7 a |n o . 
设计 ( 因为 随机 地 将 处 理 指派 给 试验 单位 ) 的 图 表 , 8 c 
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定义 13.8 上 比较 p 个 处 理 的 完全 随机 化 设计 是 把 处 理 随 机 指派 给 试验 单位 的 设计 . 

这 种 设计 有 个 明显 的 缺点 是 , 装配 时 间 依 赖 于 人 的 敏捷 性 和 经 验 等 ,从 而 在 工人 与 工人 之 间 有 
很 大 的 变化 . 一 个 包含 更 多 平均 装配 时 间 信 息 的 好 设计 是 只 用 5 个 工人 , 且 每 个 工人 分 别 用 3 种 方 
法 装配 3 只 数字 电子 表 . 这 个 随机 化 区 组 过 程 承认 了 装配 一 只 表 所 需要 的 时 间 因 工人 而 异 的 事实 ， 
比较 每 个 工人 的 3 个 装配 时 间 , 从 这 个 比较 中 消除 了 工人 之 间 的 变异 . 

















图 13.3 是 刚刚 描述 的 随机 化 区 组 设计 的 图 示 . 这 个 图 XATA) 处 理 (方法 ) 
表明 了 有 5 位 工人 , 每 位 工人 可 以 看 成 是 3 个 试验 单位 ( 装 i 四 四 四 
配 手表 ) 相应 于 分 别 利用 装配 方法 A. B. C 的 一 个 区 组 . 区 
组 是 随机 化 的 , 因为 处 理 ( 装 配方 法 ) 是 随机 地 指派 给 区 组 ; 四 四 加 
中 的 试验 单位 . 对 于 这 个 例子 ,以 随机 顺序 装配 手表 来 避免 
由 其 他 可 能 影响 装配 时 间 的 未 知 或 者 未 测量 的 变量 引起 的 3 四 四 四 
偏差 . 

一 般 地 , 比较 p 个 处 理 的 随机 化 区 组 设计 包含 6 个 相对 4 四 四 相 
同 质 的 区 组 , 每 个 区 组 包含 p 个 试验 单位 . 在 每 个 区 组 中 p 
个 处 理 随机 地 指派 给 试验 单位 , 并且 每 个 处 理 在 每 个 区 组 只 5 WEB 
出 现 一 次 . 

定义 13.9 tH p 个 处 理 的 随机 化 区 组 设计 包含 5 个 ”图 13.3 包含 b=5 个 区 组 和 p=3 个 
区 组 , 每 个 区 组 包含 p 个 相对 同 质 的 试验 单位 . p 个 处 理 随 处 理 的 随机 化 区 组 设计 图 


机 地 指派 给 每 个 区 组 中 的 试验 单位 , 每 个 处 理 分 配给 一 个 试验 单位 . 
假定 比较 4 位 运输 部 (DOT) 工 程 师 (A、B、C、D) 估计 道路 修建 合同 成 本 的 能 力 . 一 种 比 
较 方法 是 给 4 位 工程 师 随机 分 配 一 些 道路 建设 合同 (如 40 项 ) ,每 位 工程 师 10 项 ,然后 每 位 工程 师 估 
计 每 项 合同 的 成 本 y. 将 处 理 分 配给 我 们 描述 的 试验 单位 是 一 个 完全 随机 化 设计 . 

a. 讨论 在 这 个 试验 中 应 用 完全 随机 化 设计 产生 的 问题 . 

b. 解释 怎样 使 用 随机 化 区 组 设计 . 














s 
a. 对 于 DOT 试验 ,使 用 完全 随机 化 设计 的 一 个 问题 是 平均 建设 合同 成 本 的 比较 将 受到 道路 
建设 合同 性 质 的 影响 , 有 些 道路 建设 合同 会 比 其 他 的 容 AREA 工程 师 (处 理 ) 
易 估计 , 由 此 引起 的 成 本 变异 将 使 比较 处 理 的 均值 更 加 | T< E 
困难 | | 
b. 为 了 消减 比较 工程 师 平均 估计 值 时 合同 与 合同 之 2 slcla |» 








间 的 变异 性 ， 只 选择 10 项 道路 合同 , 要求 每 位 DOT 工程 

师 估计 这 10 项 合同 中 的 每 一 个 成 本 . 尽管 在 这 种 情况 下 
可 能 不 需 随机 化 , 但 是 随机 地 指派 估计 的 顺序 (在 时 间 : : 
E) 仍 是 可 取 的 . 图 13.4 给 出 了 包括 p=4 个 处 理 和 8 = 10 10 eD c| ^| 
个 区 组 的 随机 化 区 组 设计 . 1 

每 个 试验 设计 都 可 以 用 联系 响应 y 和 试验 中 因子 (处 图 13.4 例 13.2 的 随机 化 区 组 设计 图 示 

理 、 区 组 等 ) 的 多 重 回归 模型 来 表示 . 当 因子 是 本 质 上 的 定性 变量 时 (通常 是 这 样 的 情形 ) , 模型 包含 
虚拟 变量 . 例如 , 考虑 表 13.1 描述 的 完全 随机 化 设计 , 因为 试验 中 包含 了 三 个 处 理 (方法 ) 我 们 需 


g 
> 
w 
Q 
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要 两 个 虚拟 变量 . 这 个 完全 随机 化 设计 的 模型 如 下 所 示 ， 
Y =Bo *Bix, t Box, + £ 
其 中 : 
1 如 果 用 方法 A 1 如 果 用 方法 B 
ao 如 果 不 是 «o 如 果 不 是 | 

注意 ,我 们 随意 地 选择 方法 C 作为 基准 水 平 . 从 第 12 章 对 虚拟 变量 模型 的 讨论 中 可 以 知道 , 这 三 种 
方法 的 平均 响应 是 : 

Ha =Po * Bi 

lB 7 Bo * B; 

Ac 7 Bo 
回想 By 24 -Ac 7B; =n - nc. 因此 ， 为 了 估计 处 理 均值 之 间 的 差异 ， 需要 估计 HI b. 

类 似 地 , 我 们 可 以 写 出 图 13.3 的 随机 化 区 组 设计 模型 如 下 ， 


y=Bo + Bizi t Bax, + Bax3 +Baxa * Bsxs ^ Boxe +e 


处 理 效应 


区 组 效应 
Hp: 
nofi 如 果 用 方法 A 如 果 用 方法 B s=: 如 果 是 工人 1 
| lo amm ?^ |o 如 果 不 是 ” lo 如 果 不 是 
[1 如 果 是 工人 2 。 1 如 果 是 工人 3 。 /1 如 果 是 工人 4 
=h 如 果 不 是 ;= 如 果 不 是 =f 如 果 不 是 


除了 处 理 项 之 外 , 模型 包含 了 表示 5 个 区 组 (工人 ) 的 4 个 虚拟 变量 . 注意 , 随意 地 选择 工人 5 作为 基 
准 水 平 . 利用 这 个 模型 , 可 以 把 图 13.3 试验 中 的 每 个 响应 y 写成 有 的 函数 , 如 表 13.2 所 示 . 


表 13.2 图 13.3 中 给 出 的 随机 化 区 组 设计 的 响应 


区 组 (工人 ) 


处 理 (方法 ) 





A(x; =1,x, =0) 


B(x; =0,x, =1) 


C(x, =0,x, =0) 





l(x, =1,x%4 2x, =ç =0) 
2(x, =1,x3 2x, =x; 20) 
3(xs 51,x, 2x, 5x4 20) 
4( x6 21,2, 2x, =x; 20) 


5(x, 2x, =xs = xç 20) 


Yai =Po * By t3 + e. 
ya 7 Bo +B, * Ba + en 
Yas =Po +B, Bs + ens 


Yas 7 Bo * By +Be +e 


ym =Po * B; +B + Epi 
Yu 7o tf); +B, + ep 
Yes 7 Bo +B, * Bs + £g, 


Ysa 7 Bo +B, +Be + ep 


Yci =Po * B3 + ci 
yc =Po * B4 + ec 
yc3 7 Bo * Bs + ec 


Ye ^ Bo * Bg + c, 


Yas 7 Bo * Bi + eas Yes 7 Bo +B; + eps cs =Po + &cs 

CS "Theo 

例如 ,为 了 得 到 方法 A 和 工人 1 的 响应 y( 记 作 yu ) 的 模型 , 我们 将 =1, x =0, x =1, x = 
0, xs =0 fil x; =0 代入 方程 ,得 到 模型 

Yai 7Bo +B1 +B3 + eai 

现在 利用 表 13.2 说 明 随机 化 区 组 设计 如 何 减少 试验 干扰 . 

因为 每 个 处 理 都 出 现在 5 个 区 组 中 的 每 一 个 ， 每 个 处 理 有 5 个 响应 测量 值 . 对 表 13.2 中 给 出 的 
处 理 A 的 5 个 响应 取 平均 , 我 们 得 到 
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= _ Yam TYA2 T YA T Ya T Yas 
^ 5 
-[(Bo *Bi +B3 * ex) + (Bo * Bi * B4 + es) + (Bo * Bi * Bs ten) 
* (Bo * Bi * Bs * £14) * (Bo * By * 45) ]/5 
_5Bo +561 + (Bs +B, * Bs * Bs) + (Cei tEn +Em tEn Eas) 
B 5 
(B3 +B, *Bs *Be) _ 
5 +€A 











=pBo +P) + 
类 似 地 , 得 到 处 理 B # C 的 平均 响应 : 


— YBi 十 YB2 *Yp3 t Ypa * Yps 
yp 7 5 =Bo +B; + 








(B3 +B, +Bs * Be) _ 
5 tp 





= _Yc *Yc tyca tYca t Yes _ (Bs +B4 +Bs * Be) _ 
yc = 5 =P + 5 * ec 
因为 目的 是 比较 处 理 的 均值 , 我 们 感 兴趣 的 是 差 7。 - ya, YA — Yc Mye -yc 这 些 差 计 算 如 下 ; 
Ya -Ys 7 [Bo * By * (Bs * Ba * Bs * Bs)/5 +84] - [Bo +B, + (Bs +B, *Bs +Be)/5 t £y] 
- (Bi -B5) + (ea - £p) 

YA 7 Yc 7 lBo * By * (Bs +B, * Bs +Be)/5 * £4] - [Bo + (Bs * Ba * Bs +Be)/5 *£c] 28i + (24 ~ &c) 
yg -Yc = [Bo +82 + (Bs +B, * Bs * Bs)/5 * a] — [Bo + (B3 +B, * B, *Bs)/5 tec] 2B; + (Eg - Ec) 
注意 , 对 每 个 成 对 比较 , 区 组 B(B; , Bas Bs, Bo) 相互 抵消 ， 只 剩 下 处 理 B(B1, B5). 即 在 比较 处 理 均 
值 时 由 区 组 之 间 差异 产生 的 试验 干扰 被 消去 . Z, - Eg, ZÀ -sc 和 ss - ec 是 估计 量 的 误差 , 表示 掩盖 
处 理 均 值 之 间 真 实 差异 的 干扰 . 

如 果 用 表 13. 1 中 的 完全 随机 化 设计 而 不 是 随机 化 区 组 设计 , 将 会 发 生 什么 ? 因为 每 个 工人 只 
用 一 种 方法 装配 手表 , 每 个 处 理 不 能 在 每 个 区 组 中 出 现 . 因此 ， 当 比 较 处 理 均值 时 , 工人 与 工人 之 间 
的 变异 ( 即 区 组 效应 ) 将 不 会 抵消 . 例如 , y, 和 7 之 间 的 差 将 是 ， 

Ya -Yc - By + (不 能 消去 的 区 组 B) + (g, — 8c) 
估计 量 的 误差 

因此 , 对 于 完全 随机 化 设计 ， 估计 量 的 误差 将 增加 一 个 没 被 抵消 的 区 组 效应 (6B; , Ba, Bs 和 pe ) 的 量 . 
对 随机 化 区 组 设计 , 这 些 增 大 估计 量 误差 的 效应 被 抵消 ， 因此 减少 了 试验 中 的 干扰 . 
考虑 例 13.2, 用 随机 化 区 组 设计 来 比较 4 位 DOT 工程 师 的 平均 道路 建设 成 本 的 估计 . 图 
13.4 给 出 了 这 个 设计 . 

a. 写 出 随机 化 区 组 设计 的 模型 . 

b. 解释 a 中 模型 的 B 参数 . 

c. 怎样 用 a 的 模型 来 检验 4 位 工程 师 的 平均 估计 值 之 间 的 差异 . 

解 

a. 试验 包含 了 一 个 4 水平 的 定性 因子 工程 师 , 有 4 个 表示 处 理 . 试验 的 区 组 是 10 项 道路 建设 合 
同 . 因此 , 模型 是 : 


E(y) 5o + Bii +B2%2 +B3%3 + Baxa +Bsxs + ++ + B12X12 
处 理 (工程 师 ) 区 组 (合同 ) 
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其 中 : . 
1 如 果 是 工程 师 A l 如 果 是 工程 师 B _ [1 如 果 是 工程 师 C 
n7 lo 如 果 不 是 Kas lo 如 果 不 是 un lo 如 果 不 是 
1 如 果 是 合同 1 1 如 果 是 合同 2 _ [1 如 果 是 合同 9 
un lo 如 果 不 是 57 lo 如 果 不 是 0 m7 lo 如 果 不 是 
b. 注意 随意 地 选择 工程 师 D 和 合同 10 作为 基准 水 平 . B 的 解释 如 下 : 
Bi =u, -AD ”对 于 给 定 的 合同 
P2 =n -AD 对 于 给 定 的 合同 
Bs =c - Ap 对 于 给 定 的 合同 
Ba =u -Ko 对 于 给 定 的 工程 师 
Bs =u -Kio 对 于 给 定 的 工程 师 
Bu 9 Mo -uio 对 于 给 定 的 工程 师 


c. 确定 4 位 工程 师 的 均值 是 否 不 同 的 一 种 方法 是 检验 原 假设 
Ho: pa =p =c =p 
M b 中 对 有 的 解释 , 这 个 假设 等 价 于 检验 : 
Ho: Bi 2 B; - B4 =0 
为 了 检验 这 个 假设 ， 我 们 从 完全 模型 中 删除 处 理 8(p) , p, 和 B4) , 并 拟 合 简化 模型 . 
E(y) =Bo * Buxa * Bsxs i +B% 
BUE METTECEBUS 屎 检验 (参看 12.8 节 ) ,这 里 
F- ( SSE Reduced ~ SSE Complete )/3 
" MSE Complete 

随机 化 区 组 设计 给 出 了 减少 干扰 设计 的 最 简单 类 型 之 一 ， 其 他 更 复杂 的 设计 是 利用 区 组 化 原则 
来 消去 在 2 个 或 者 更 多 方向 上 的 趋势 或 者 变异 . 当 想 消除 变异 的 两 个 来 源 ( 即 想 在 两 个 方向 上 分 区 ) 
时 , 拉丁 方 设计 是 有 用 的 ， 拉丁 立方 设计 允许 我 们 在 三 个 方向 上 分 区 . 当 区 组 里 包含 的 试验 单位 小 于 
处 理 个 数 时 , 在 分 区 时 会 出 现 更 大 的 变异 ， 恰当 地 指派 处 理 给 指定 数量 的 区 组 ， 仍然 可 以 得 到 不 受 
区 组 效应 影响 的 处 理 对 之 间 差 的 估计 ， 这 些 称 为 不 完全 区 组 设计 . 关于 如 何 建立 更 加 复杂 的 区 组 设 
计 的 细节 可 以 参考 相关 文献 . 


应 用 练习 
13.1 设计 试验 . 在 一 个 设计 的 试验 中 ， 
a， 影 响 信 息 量 的 两 个 因子 是 什么 ? 
b. 分 区 怎样 增加 信息 量 ? 
13.2 弹性 工作 时 间 表 . 研究 者 近来 做 了 一 个 试验 ， 





c. 号 出 完全 随机 化 设计 的 模型 . 

13.3 38 E 8 38 doe A dar. Applied Animal Behaviour 
Science (2000 年 10 H) 发 表 了 --- 简 关于 家 养 鸡 尾 
鹦 蛋 味 觉 偏好 的 研究 , 将 在 加 利 福 尼 亚 大 学 戴 维 其 
喂养 的 鸟 样本 随机 地 分 成 3 个 试验 组 . 组 1 YAT 
两 边 都 喂 瓶 装 纯净 水 ;组 2 在 第 子 的 一 边 喂 水 ; 另 


比较 如 下 三 种 类 型 工作 时 间 表 的 工人 平均 工作 满 

意 度 E(y) :弹性 时 间 ( 允 许 工人 自己 设 定 他 们 的 工 

作 时 间 表 )、 错 开 起 始 时 间 和 固定 时 间 . 

a. 指出 这 个 试验 的 处 理 . 

b. 假定 由 60 个 工人 参与 研究 ,说明 对 这 个 试验 怎 
样 用 完全 随机 化 设计 . 


一 边 喂 流体 蔗糖 ( 垂 ) 合剂 ;组 3 在 一 边 喂 水 , 另 一 

边 喂 一 种 液体 氧化 钠 ( 酸 ) 合剂 . 研究 者 感 兴趣 的 

变量 是 每 只 鸡 尾 鹦 站 的 液体 总 消耗 量 . 

a. 这 项 研究 的 试验 单位 是 什么 ? 

b. 这 项 研究 是 一 个 设计 的 试验 吗 ? 是 娜 种 类 型 的 
设计 ? 
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c. 研究 中 的 因子 是 什么 ? 

d. 给 出 每 个 因子 的 水 平 . 

e. 研究 中 有 多 少 个 处 理 ? 请 具体 列 出 . 
f. 响应 变量 是 什么 ? 

g 对 这 个 设计 的 试验 , 写 出 回归 模型 . 

13.4 JW CT 扫描 . 南 佛罗里达 大 学 对 50 000 名 
吸烟 者 进行 临床 试验 来 比较 CT 扫描 和 X 射线 在 发 
现 肺癌 上 的 有 效 性 . ( Today' s Tomorrous , 2002 年 
秋 . ) 每 个 参加 的 吸烟 者 随机 地 指派 使 用 CT 扫描 和 
X 射线 这 两 种 方法 中 的 一 种 进行 试验 , 并 确定 扫描 
方法 第 一 次 发 现 肿瘤 的 年 龄 (年 ). 研究 的 目的 之 一 
是 比较 两 种 扫描 方法 第 一 次 发 现 癌症 的 平均 年 龄 
a. 指出 研究 的 响应 变量 . 

b. 指出 研究 的 试验 单位 . 

c. 指出 研究 的 因子 . 

d. 指出 研究 的 处 理 . 

e. 所 用 的 设计 类 型 是 完全 随机 化 还 是 随机 化 区 组 ? 

13.5 回旋 式 抽 油 装置 . 石油 工程 师 想 比较 三 个 州 
(加 利 福 尼 亚 州 、 犹 他 州 和 阿拉 斯 加 州 ) 每 个 月 运 
行 的 回旋 抽 油 装置 的 平均 数量 . 考虑 到 月 间 的 恋 
F, 在 2 年 中 随机 选取 3 个 月 , 由 World Oil (2002 
年 1 月) 杂志 提供 的 数据 得 到 每 个 州 每 个 月 运行 的 
抽 油 装置 台数 ,下 表 给 出 数据 . 





月 /年 加 利 福 尼 亚 犹他 ”阿拉 斯 加 
11/2000 27 17 11 
10/2001 34 20 14 
11/2001 36 15 14 


a. 在 比较 加 利 福 尼 亚 、 犹 他 和 阿拉 斯 加 州 每 个 月 
运行 的 抽 油 装置 平均 台数 时 , 为 什么 随机 化 区 


13.5 增加 容量 设计 


组 设计 比 完 全 随机 化 设计 更 好 ? 
b. 指出 试验 的 处 理 . 
c. 指出 试验 的 区 组 . 


13.6 建筑 物 的 偏 移 率 . 估计 受到 横向 负荷 建筑 物 可 


靠 性 的 常用 指标 是 偏 移 率 . 已 经 开发 了 如 STAAD-HI 

高 级 计算 机 程序 基于 梁 的 刚性 、 柱 的 刚性 、 层 高 度 

和 惯性 矩 等 变量 来 估计 偏 移 率 . 纽约 州立 大 学 布 法 

罗 分 校 和 佛罗里达 中 央 大 学 的 土木 工程 师 进 行 了 一 

项 试验 比较 用 STAAD-II 和 一 种 新 的 称 为 DRIFT 更 

简单 的 微型 计算 机 程序 产生 的 偏 移 率 估计 . ( Micro- 

computers in Civil Engineering, 1993). —^ 21 层 建筑 

物 的 数据 作为 程序 的 输入 . 用 STAAD-III 运行 两 次 ， 

第 一 次 考虑 建筑 物 园 柱 的 轴 变形 ， 第 二 次 忽略 这 个 

信息 . 分 析 的 目的 是 比较 由 这 三 次 计算 机 运行 估计 

的 平均 偏 移 率 ( 这 里 偏 移 作为 横向 位 移 度量 ). 

a. 指出 试验 的 处 理 . 

b. 因为 横向 位 移 在 建筑 物 的 不 同 水 平 ( 层 ) 有 很 大 
不 同 ， 用 一 个 随机 化 区 组 设计 来 减 小 偏 移 在 层 
与 层 之 间 的 变异 . 如 果 研 究 包 括 所 有 的 21 E, 
用 图 形 解释 设计 的 步骤. 

c. 写 出 随机 化 区 组 设计 的 线性 模型 . 


13.7 DOT 道路 建设 合同 成 本 估计 . 考虑 例 13. 2 和 


例 13.3 用 随机 化 区 组 设计 比较 4 位 DOT 工程 师 估 

计 的 平均 成 本 . 

a. 写 出 工程 师 B 估计 的 成 本 y 的 每 个 观测 模型 ， 
对 观测 求 和 得 到 工程 师 B 的 平均 值 . 

b. 对 工程 师 D 重复 a 的 步 双 . 

c. 证 明 : (Fs -y5) «B, + (z; -Bo) ,注意 在 计算 这 
个 差 时 ,区 组 的 8 被 抵消 了 . 


这 一 节 我 们 关注 怎样 适当 地 选择 与 2 个 或 者 更 多 因子 关联 的 处 理 , 这 样 可 以 增加 从 试验 中 提取 
的 信息 “容量 ”. 我 们 将 要 讨论 的 增加 容量 设计 通常 称 作 析 因 设计 ， 因为 它们 涉及 试验 中 因子 水 平 


( 即 处 理 ) 组 合 的 选择 . 


考虑 一 家 公共 事业 公司 , 该 公司 对 它 的 客户 在 非 高 峰 ( 低 需 求 ) 时 间 段 用 电 收 取 较 低 的 费用 ,公司 
正在 对 几 种 白天 时 间 计 价 表 进 行 试验 . 公司 可 以 控制 的 制定 计划 表 的 两 个 因子 ( 即 自 变 量 ) 是 价格 比 x, 
《用 高 峰 与 非 高 峰 价格 比 来 度量 ) 和 高 峰 时 段 长 度 x, 《用 小 时 度量 ) , 假定 公共 事业 公司 想 研究 两 水 平 
的 价格 比 (200% 与 400% ) 和 高 峰 时 段 长 度 (6 与 9b). 对 几 种 不 同 的 计价 表 ( 即 x 和 xz 的 组 合 ), 公司 
度量 客户 满意 度 y, 目的 是 比较 计价 表 的 平均 满意 程度 . 对 这 个 试验 ,公司 应 该 怎样 选择 处 理 . 

选择 为 试验 单位 (客户 ) 指派 价格 比 (高 峰 时 段 长 度 水 平 ) 的 一 种 方法 是 用 “每 次 一 个 ”的 方法 , 按 
照 这 种 方法 ,一 个 自 变量 变化 时 , 其 余 自 变量 保持 不 变 . 对 试验 中 的 每 个 自 变量 重复 这 个 过 程 . 这 个 
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计划 看 起 来 非常 合理 并 且 与 13. 4 节 所 介绍 的 区 组 概念 一 致 即 在 相对 同 质 的 条 件 下 进行 比较 ) ,但 
这 不 是 我 们 将 要 演示 的 情况 . 

用 于 价格 比 (xi ) 和 高 峰 时 段 长 度 (x2 ) 的 “每 次 一 个 "方法 如 图 13.5 所 示 . 当 长 度 固定 为 z> = 6 时 ， 
在 价格 比 x! =200% 和 xi =400% 处 观测 响应 >, 用 得 到 的 一 对 y 值 来 估计 因 价格 比 (xi ) 变化 导致 顾客 满 
意 度 的 平均 变化 . 同样 , 当 价 比 固定 为 x =200% , 观测 在 高 峰 时 段 长 度 为 x =9 h 时 的 响应 y. 这 个 观测 
与 (200% , 64) 的 观测 一 起 ， 允许 我 们 估计 因 高 峰 时 段 长 度 (x, ) 变化 引起 的 顾客 满意 度 的 平均 变化 . 网 
才 描 述 的 (200% , 6h) (400% , 6h) 和 (200% , 9 上) 三 个 处 理 表示 为 图 13.5 中 的 点 . 注意 这 幅 图 对 每 个 
处 理 给 出 两 个 测量 值 (点 ) ,为 了 得 到 感 兴趣 的 差 的 标准 差 估 计 ， 这 是 必须 的 . 

第 一 种 选择 因子 水 平 组 合 的 方法 是 先 选择 与 “每 次 一 个 "方法 相同 的 三 个 处 理 ， 然后 再 选择 如 图 
13.6 所 示 在 (400% , 9b) 的 第 4 个 处 理 . 换 句 话说 ， 我 们 同时 改变 变量 x| 和 xo. . 
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图 13.5 选择 处 理 的 “每 次 一 个 ”方法 图 13.6 选择 所 有 可 能 的 处 理 


这 两 个 设计 哪 种 能 提供 更 多 的 处 理 差 信 息 ? 出 乎 意料 的 是 , 只 有 4 次 观测 的 图 13.6 中 的 设计 比 
用 了 6 次 观测 的 “每 次 一 个 "方法 提供 了 更 准确 的 信息 . 首先 注意 到 两 种 设计 在 高 峰 时 段 长 度 (x, ) El 
定时 ,得 到 在 x, =200% I x, =400% 处 平均 响应 y 之 差 的 两 个 估计 . 以 及 当 价 格 比 (x ) 固定 时 ， 得 到 
平均 响应 y 在 x, =6h lx, =9 h 处 两 个 设计 之 差 的 两 个 估计 . 但 是 , 假如 在 =200% 和 xi =400% 时 平 
均 响 应 7 之 间 的 差 依赖 于 x, 固定 在 哪个 水 平 , 即 如 果 价 格 比 (xi) 和 高 峰 时 段 长 度 (x, ) 存 在 交互 作用 
时 ,会 怎样 呢 ? 那么 , 我 们 需要 估计 x, =6 时 的 均值 差 (wzo -Asoo) 和 xz =9 时 的 均值 差 (uzo -paoo). 这 
两 个 差 的 估计 都 可 以 由 图 13.6 所 示 的 第 二 种 设计 得 到 . 但 是 , 因为 “每 次 一 个 ”方法 没有 估计 | =400% 
以 及 % =9 时 的 平均 响应 , 这 种 设计 不 能 发 现 交互 作用 . 

在 第 11 章 和 第 12 章 已 经 强调 过 自 变量 之 间 交 互 作用 的 重要 性 ， 如 果 存在 交互 作用 , 我 们 不 能 
人 研究 一 个 变量 (或 者 因子 ) 对 响应 y 的 影响 ， 而 不 考虑 其 他 变量 . 因此 需要 提供 因子 交互 作用 信息 的 
试验 设计 . 

能 够 达到 这 个 目的 的 设计 称 作 析 因 试 验 . 一 个 完全 析 因 试验 是 包括 所 有 可 能 的 因子 水 平 组 合作 为 
处 理 的 试验 . 对 于 白天 时 间 计价 试验 , 我 们 有 两 个 价格 比 水 平 (200% 和 400% ) 、 两 个 高 峰 时 段 长 度 水 平 
(6h 和 9h). 因此 , 一 个 完全 析 因 试验 包括 (2 x2)4 个 处 理 ( 如 图 13.6 所 示 ) 称 为 2 x2 因子 设计 . 

定义 13.10 析 因 设计 是 一 种 选择 包含 在 试验 中 的 处 理 ( Ep 因子 水 平 组 合 ) 的 方法 . 完全 析 因 试 
验 是 由 全 部 因子 水 平 组 合 组 成 处 理 的 试验 . 

如 果 再 选 第 3 个 因子 (如 四 水 平 的 季节 ) , 那 一 个 完全 析 因 试验 将 包含 全 部 2 x2 x4 = 16 个 价 
格 比 、 高 峰 时 段 长 度 、 季 节 水 平 组 合 ， 得 到 的 数据 集 称 作 2 x2 x4 析 因 设计 . 
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LX 假定 要 做 试验 来 比较 在 硫酸 溶液 中 充电 的 镍 合金 拉 伸 试 样 的 抗 张强 度 , 特别 要 研究 如 下 3 


个 因子 对 平均 抗 张强 度 的 影响 : 三 水 平 的 镍 成 分 
(Ai, A; 和 As )、 三 水 平 的 充电 时 间 (B; , B, 和 了 B; ) 
和 两 水 平 的 合金 类 型 (C; 和 C,). 考虑 一 个 完全 析 因 
试验 , 确定 对 这 个 3 x3 x2 析 因 设计 的 处 理 . 

解 完全 析 因 试验 包括 所 有 可 能 的 镍 成 分 、 
充电 时 间 、 合 金 类 型 的 水 平 组 合 , 因此 包含 了 下 面 
的 处 HE: AQBQC,, A,rB,C,. A,rB,C,. A,B,;C,. 
Al1BsCl 、AlBaC2 、AzBiC; 、A2BiC; A,B,C], 
4A2B2C2 、AzB3Ci 、A2B3C 、A3B;C、A3B;C,、 
AsB,C,. A3B3C3, A3B3C1, A3B3C3, E] 13.7 给 出 
了 这 18 个 处 理 . 

析 因 设计 的 多 元 回归 模型 包含 试验 中 每 个 因 
子 项 ( 称 作 主 效应 ) 和 因子 交互 作用 项 . 例如 , 白天 


E 充电 时 间 合金 


= 
Oo 


T 


个 
A ÀM 


E 
AN o n 


p 


A 


(处 理 ) 
(1) 


(2) 
(3) 


(4) 
(5) 


(6) 
(0) 


(8) 
(9) 


(10) 
(11) 


2) 
(13) 


5 


时 间 计 价 试验 的 2 x2 因子 模型 包含 定量 因子 价格 

E(x) 的 一 次 项 、 定 量 因 子 高 峰 时 段 长 度 (25) 的 

一 次 项 和 一 个 交互 作用 项 : 

y=pBo + Bii tBox + Baxixo +e 
AN ARN 

一 般 地 ,k 个 因子 的 完全 析 因 设 计 模 型 包含 下 面 的 项 . 
个 因子 的 主 效应 
所 有 因子 对 的 双向 交互 作用 项 
所 有 三 因子 组 合 的 三 向 交互 作用 项 


(14) 
(15) 


> 
iere 


个 A 
it 


(16) 
(7) 


(18) 
图 13.7 例 13.4 的 3x3x2 析 因 设计 的 18 个 处 理 


= 
op 


AAA 


AD 


所 有 因子 组 合 的 向 交互 作用 项 
如 果 因 子 是 定性 的 , 则 按照 下 例 的 方法 设置 虚拟 变量 . 
写 出 例 13.4 中 的 3 x3 x2 析 因 试验 模型 . 
解 ” 因 为 因子 是 定性 的 , 所 以 设置 如 下 的 虚拟 变量 ， 


_ [1 如 果 是 镍 A, /1 URERA, _ [1 如果 是 充电 时 间 Bi 
-fo 如 果 不 是 -fo 如 果 不 是 sz, 如 果 不 是 
_ /1 如 果 是 充电 时 间 B 1， 如果 是 合金 C， 

“= 如 果 不 是 s; 如 果 是 合金 C, 

那么 合适 的 模型 是 ; 


y=Bo + Pian) +B;x, + Bszxs t Bax, + Bsxs + Bexix3 +B7x1x4 + Bgt% + Box» x, 
a cv Vs, Ár, —IWV 
镍 主 效应 cm Xa 合金 主 效应 # x 充电 
+ Blox1xs +B11x2x5 + Bi2x3xs +Bi3x4xs + Bus xaxs +B1Isx1x4xs * Bigxaxaxs + B17x2X4xs 


镍 x 合金 充电 x 合金 镍 x 充电 x 合金 


532 第 13 章 





注意 , 例 13.5 的 3 x3 x2 析 因 设计 模型 里 有 18 个 参数 , 它 等 于 包含 在 试验 中 的 处 理 个 数 . 对 于 
完全 析 因 试验 , 这 个 结论 总 成 立 . 因此 , 如 果 对 析 因 处 理 的 单 -- 重 复 ( 即 每 个 处 理 测 量 一 个 y 观测 
值 ) 拟 合 模 型 , 将 没有 自由 度 可 用 于 估计 误差 方差 o. 解决 这 个 问题 的 一 种 方法 是 增加 样本 中 的 额 
外 数据 点 . 研究 者 通常 用 重复 因子 处 理 的 完全 集合 来 完成 , 即 对 于 试验 中 的 每 个 处 理 ， 收集 2 个 或 者 
更 多 的 y 观 测 值 . 从 而 为 估计 o? 提供 足够 的 自由 度 . 

完全 析 因 试验 一 个 潜在 的 缺点 是 它 可 能 需要 大 量 处 理 . 例如 , 一 个 包含 10 个 两 水 平 因子 的 试 
验 , 需要 2”=1024 个 处 理 ! 在 确定 大 量 因子 中 哪些 是 影响 响应 y 的 控制 性 研究 中 , 可 能 会 出 现 这 种 
情况 . 有 几 种 只 要 求 完 全 析 因 试验 所 有 处 理 中 的 一 部 分 处 理 的 增 量 设计 ,因此 称 它们 为 部 分 析 因 试 
36. 部 分 析 因 试 验 可 以 得 到 低 阶 项 (如 主 效应 和 双向 交互 作用 项 )B 系数 的 估计 ; 但 是 , 某 些 高 阶 项 
(如 三 因子 或 者 四 因子 交互 作用 项 ) 的 B 系数 将 会 和 某 些 低 阶 项 一 样 , 混杂 试验 结果 . 因此 ， 需要 用 
很 多 专门 的 技术 来 进行 和 解释 部 分 析 因 试验 . 关于 部 分 析 因 和 其 他 更 复杂 的 增加 容量 试验 的 细节 ， 
请 阅读 相关 文献 . 


(9) 应 用 练习 


19.8 面包 酵母 和 啤酒 酵母 . Electronic Journal of Bio- 


Ti ( Human Factors, 1993 年 6 月 ). 采用 连续 一 致 或 
者 调整 一 致 这 两 种 方法 中 的 一 种 对 大 学 生 在 微型 
计算 机 上 进行 培训 , 将 每 个 学 生 指 派 到 6 个 不 同 的 


technology (2003 年 12 月 15 日 ) 刊 登 了 一 篇 比较 研 

究 两 种 酵母 膏 ( 面包 酵母 和 啤酒 酵母 ) 的 文章 . 啤酒 

酵母 是 啤酒 厂 的 剩余 副产品 , 因此 比 作为 主 产品 生 

” 产 的 面包 酵母 便宜 . 两 种 酵母 膏 的 样本 放 在 4 种 不 
同 温度 下 (45% , 48C, 51C 和 54% ) , 测量 每 种 醇 

母 -温度 组 合 的 自 溶 率 ( 记 录 为 百分比 ). 分 析 的 目 

的 是 研究 酵母 膏 和 温度 对 平均 自 溶 率 的 影响 ， 

a. 指出 试验 中 的 因子 ( 和 因子 水 平 ). 

b. 指出 响应 变量 . 

c. 试验 包含 了 多 少 个 处 理 ? 

d. 所 用 的 试验 设计 类 型 是 什么 ? 

13.9 AK P t H. Environmental Science & En- 

gineering (2000 年 9 月 1 日) 给 出 了 一 项 关于 用 凝 

结 微量 过 滤 过 程 来 去 掉 水 中 细菌 的 研究 . 首尔 国立 

大 学 的 化 学 工程 师 设 计 了 一 个 试验 ,估计 凝结 剂 

水 平和 酸性 (pH) 水 平 对 过 程 过 滤 效 率 的 影响 . 利 

用 六 水 平 的 凝结 剂 (5，10，20，50，100 和 

200 mg/L) 和 六 水 平 的 pH f& (4.0, 5.0, 6.0, 7.0, 

8.0 和 9.0), 从 韩国 首尔 的 汉 河 中 选取 水 样品 放 在 

I HUP, 每 个 广 口 瓶 随机 指派 给 6 x6 236 RISE 

结 剂 和 pH 值 水 平 组 合 中 的 一 个 . 

a. 在 这 个 研究 中 应 用 了 哪个 类 型 的 试验 设计 . 

b. 给 出 研究 的 因子 、 因 子 水 平和 处 理 . 

19.10 视觉 搜索 任务 . 很 多 有 监视 要 求 的 工作 (如 

空中 交通 控制 、 雷 达 / 声 纳 操 作 ) 都 要 求 对 视觉 信 

息 进 行 有 效 处 理 , 乔治 亚 理工 学 院 的 研究 者 研究 

了 影响 执行 视觉 搜索 任务 的 受 试 者 的 反应 时 间 变 


实践 期 中 的 一 个 . 最 后 , 在 4 个 程度 ( 100% 一 致 、 
6776 、50% 或 者 33% ) 上 操作 搜索 任务 的 一 致 性 . 
研究 者 的 目的 是 比较 指派 2x6 x4 =48 种 (培训 方 
法 ) x 实践 期 x (任务 一 致 性 ) 试 验 条 件 中 的 每 一 
种 的 学 生平 均 反 应 时 间 . 

a， 列 出 试验 中 的 因子 . 

b. 对 每 个 因子 , 说 明 它 是 定量 的 还 是 定性 的 . 

c. 试验 有 多 少 个 处 理 ? 列 出 它们 . 


13.11 ARRE. 质量 控制 主管 以 标 度 0 ~ 10 测量 钢 


锭 的 质量 . 设计 一 个 利用 3 种 不 同 的 温度 (1100 ~ 
1200T 范 围 内 ) 和 5 种 不 同 的 压强 (500 ~ 600 Ib/in? 
范围 内 ) 的 试验 , 每 种 温度 - 压强 水 平 组 合 下 生产 
20 个 钢锭 . 指出 下 面 的 试验 元 素 : 

a. 响应 . 

b. 因子 和 因子 类 型 . 

c. 人 处理. 

d. 试验 单位 . 


13.12 析 因 模型 . 


a. 写 出 一 个 2 x3 析 因 试验 的 完全 析 因 模型 ,其 中 
两 个 因子 都 是 定性 的 . 

b. 写 出 2 x3 x3 析 因 试验 的 完全 析 因 模型 ,其 中 
两 水 平 因子 是 定量 的 , 其 他 两 个 因子 是 定性 的 . 


13.13 因子 交互 作用 . 考虑 两 个 因子 A 和 B, 每 个 


因子 有 三 水 平 的 析 因 设计 . 假定 选择 下 面包 含 在 试 
验 中 的 处 理 ( 因子 水 平 ) 组 合 : AB, AB, AB, 
A,B, 和 A, B,. 

a. 这 是 一 个 完全 析 人 内 试验 吗 ? 请 解释 . 
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b. 说 明 为 什么 不 能 在 这 个 试验 中 研究 交互 作用 AB. 一 个 因子 、 固 定 其 他 两 个 因子 . 
13.14 因子 设计 发 布 . 假定 我 们 要 研究 三 个 定性 b. 为 什么 随机 化 区 组 设计 在 使 用 时 是 一 个 不 
因子 对 响应 y 的 影响 . 好 的 设计 ? 


a. 说 明 为 什么 处 理 的 因子 选择 好 于 每 次 变化 


13.6 选择 样本 容量 


第 7 章 说 明 了 在 估计 单个 总 体 均值 和 比较 两 个 总 体 均值 时 怎样 选择 样本 容量 ,现在 来 说 明 对 设 
计 的 试验 怎样 解决 这 个 问题 . 

正如 在 13.3 节 中 提 到 的 , 在 与 某 个 总 体 参数 有 关 的 试验 中 ， 信息 量 的 度量 是 这 个 参数 估计 量 的 
标准 误差 , 一 个 更 实际 的 度量 是 参数 置信 区 间 的 半 宽 ， 当然 也 是 一 个 标准 误差 的 函数 . 例如 , 总 体 均 
值 的 置信 区 间 的 半 宽 (7.6 节 给 出 ) 是 ; 


to255 = 2 
类 似 地 , ER yM 的 线性 模型 斜率 A, 的 置信 区 间 半 宽 (10.6 节 给 出 ) 是 : 


$ 1 
(to ) spb, = ius (ss) = ca 225] (s) 

在 这 两 种 情形 下 ， 半 宽 是 试验 中 数据 点 总 数 的 函数 . 当 数 据点 总 数 n 增加 时 ， 每 个 区 间 半 宽 减 
小 . 对 于 一 般 线性 模型 的 参数 B; 的 置信 区 间 、 E(y) 的 置信 区 间 和 yy 的 预测 区 间 ， 上 述 结论 同样 成 立 . 
因为 每 个 设计 的 试验 可 以 用 线性 模型 表示 ， 这 个 结果 可 以 用 来 近似 地 选择 试验 的 重复 次 数 ( 即 度量 
每 个 处 理 的 观测 值 个 数 ). i 

例如 ,考虑 包含 三 个 处 理 A、B、C 的 试验 设计 . 假定 要 估计 B 和 C 的 处 理 均 值 间 的 差 (jp -pc ). 
根据 对 设计 试验 的 线性 模型 的 知识 ， 我 们 知道 这 个 差 可 以 用 模型 中 的 6 参数 (如 pB;) 表示. 

对 单一 重复 试验 的 B,, 置 信 区 间 是 : 





B; t (7) 58, 
如 果 人 恰好 重复 同样 的 试验 r 次 ( 称 为 次 重复 )， 可 以 证 明 ( 证 明 略 )6, 的 置信 区 间 是 ， 


B; tod | z) 


B 


_ (24) (s ) 
P o 
A2 Tk r, 首先 把 区 间 的 半 宽 设置 为 我 们 愿意 容忍 的 最 大 B B, 然后 近似 (i,,,) 和 s£ ， 解 出 重复 的 次 数 r. 





确定 重复 次 数 + 

以 (1 -a)100% 置 信和 度 , 估计 值 B, 在 B 个 单位 内 所 需要 的 重复 次 数 上 是， 
(2) Gg.) 
r= ——— 


Bp 








^x E 
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EXE] 考虑 一 个 x2 析 因 试验 , 研究 两 个 因子 对 用 于 照相 机 闪光 灯 的 光 输 出 的 影响 . 这 两 个 因 
子 ( 和 它们 的 水 平 ) 是 : x =E pA E (100 和 200mg) 和 x = 封 接 机 的 速度 (1.2 和 1.3 r/min). 
2 x2 析 因 试 验 的 完全 模型 是 : 
E(y) 2 Bo * Byxy * Bax; +B3x1%2 

利用 9596 置信 区 间 , 使 交互 作用 B 的 估计 B; 在 其 真 值 的 0.3 之 内 , 要 重复 多 少 次 2 x2 析 因 试验 ? 

解 为 了 求解 重复 次 数 >， 需 要 解 方程 

2 

_ (25) (s ) 
=— 
可 以 看 到 我 们 必须 得 到 so. 的 估计 , 即 单一 重复 时 B 的 标准 误差 . 假定 从 闪光 灯 厂 商 以 前 的 试验 知道 
sé, ~0.2. 对 于 95% 置 信 区 间 ,a =0.05,a/2 =0.025. 现在 , to 0zs 的 自由 度 依赖 于 样本 容量 n- (2x 
2)r «4r; 因此 , 必须 取 它 们 的 近似 值 . 事实 上 ， 因 为 模型 包含 4 个 参数 , 误差 的 自由 度 是 :df( 误 差 ) = 
n-4=4r-4=4(r-1). 我 们 至 少 要 求 两 次 重复 ; 因此 , 我 们 至 少 有 4(2 -1) =4 个 自由 度 . 在 表 B.7 
中 ， 对 df 24, 加 .025 = 2.776. 在 计算 中 将 用 Í9. 025 的 这 个 保守 估计 . 

因为 我 们 希望 区 间 的 半 宽 为 B=0.3, 因此 ， 


r 














(tos) (sp,)” (2, 776)2(0.2)? 3 42 表 13.3 重复 4 次 的 2 x2 析 因 试 验 
B? |^ (03) ^ EE x, 
因为 重复 3 或 4 次 (但 不 是 3.42) ， 所 以 应 该 T " jo 
选择 4 次 重复 以 较 好 地 保证 估计 交互 作用 参 | 
数 B, 在 其 真 值 的 0.3 Z IN. 重复 次 数 为 4 的 x L2 | 关于 y 的 4 次 观测 ”关于 y 的 4 次 观测 
2 x2 析 因 试验 如 表 13.3 所 示 . L3 | 关于 y 的 4 次 观测 ”关于 y 的 4 次 观测 
应 用 练习 TT 
13.15 重复 .为 什么 重复 在 完全 析 因 试验 中 很 重要 ? 1317 ARRAK. 对 于 有 ”个 区 组 的 随机 化 区 组 
13.16 ”确定 重复 的 次 数 , 考虑 一 个 2 x2 析 因 设计 . 设计 , 任何 两 个 处 理 均 值 间 的 差 估 计 的 标准 误差 


FH 9095 置信 区 间 估 计 交 互 作用 项 系数 8 在 两 个 单 估计 是 27b. 由 这 个 公式 利用 95% 置信 区 间 确 定 
位 内 , 需要 重复 多 少 次 ? 假定 交互 作用 项 8 估计 量 使 估计 两 个 处 理 均值 的 差 (jw -js) 在 10 个 单位 内 
的 标准 误差 (基于 单一 重复 ) 近 似 为 3. 所 要 求 的 区 组 数 ,假定 s=15. 


13.7 随机 化 的 重要 性 


本 章 给 出 的 所 有 基本 设计 都 涉及 某 种 随机 化 . 在 完全 随机 化 设计 和 基本 析 因 试 验 中 ,处理 随机 
地 指派 给 试验 单位 ; 在 随机 化 区 组 设计 中 , 随机 地 选择 区 组 , 上 且 每 个 区 组 中 的 处 理 按照 随机 的 顺序 
指派. 为 什么 随机 化 ? 答案 和 我 们 对 线性 模型 中 随机 误差 + 的 假定 有 关 . 回想 (11.2 节 ) 假 定 对 于 自 
变量 的 固定 设置 ( 即 每 个 处 理 ) e 服从 均值 为 0、 方 差 o? 为 常数 的 正 态 分 布 ,进一步 假定 与 重复 观 
测 相 关联 的 随机 误差 在 概率 意义 上 是 相互 独立 的 

试验 者 很 少 知道 过 程 中 所 有 重要 的 变量 , 也 不 知道 模型 的 真实 函数 形式 . 因此 ,选择 用 来 拟 合 
真实 关系 的 函数 形式 只 是 一 个 近似 , 并且 试 验 中 包含 的 变量 只 是 全 部 变量 的 一 个 子 集 , 随机 误 闫 ¿ 
是 由 于 没有 包含 所 有 重要 因子 所 导致 的 误差 及 对 函数 近似 产生 的 误差 的 综合 误差 

在 进行 设计 的 试验 时 ,尽管 许多 未 测量 的 且 对 响应 y 是 重要 的 自 变量 不 以 完全 随机 的 方式 变 
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化 , 但 仍 希 望 它们 的 累计 效应 以 随机 方式 变化 , 且 满 足 所 基于 的 推断 方法 的 假定 . 一 个 设计 试验 的 
随机 化 具有 把 这 些 误差 影响 随机 指派 给 处 理 的 效果 ， 并 且 有 助 于 满足 e 的 假定 . 
快速 回顾 
重要 公式 
E(y) =Bo t Bixy * Box, + +Bp-1%p-1 Pp 水 平 的 单 因子 完全 随机 化 设计 模型 
这 里 a; =1, 如 果 是 第 i 个 水 平 ; 0, 如 果 不 是 


EG) =B + Bi tB B, p 个 处 理 , b 个 区 组 的 随机 化 区 组 设计 模型 
— REDE “ 
+ Boxp +B, nya + Breb 2%, ua 
LUT EI 
这 里 x = 1 ,如果 处 理 / 区 组 为 ;0, 如 果 不 是 
E(y) =po + Bin +para Baa a 水 平 的 因子 A 和 水平 的 因子 B 的 析 因 设计 模型 
[PARUM 
+ Baxa tax ua t t Bua axis 
DUFBÁGRON 
(ta Y Big) mua, Butt, e Baix masta 以 (1 -a) x100% 置 信 , 估计 值 B; 在 巨 个 单位 之 内 所 
"B A x BEATEN 要 求 的 重复 次 数 








P 处 理 个 数 

区 组 个 数 
axt ARB 一 个 “水 平 的 因子 与 另 一 个 5 水 平 的 因子 的 两 因子 析 因 设计 
a xbxc AGE BEC 第 一 个 因子 为 a 水平 ， 第 二 个 因子 为 水平 , 第 三 个 因子 为 


“水 平 的 三 因子 析 因 设计 


r 重复 数 
ML 


本 章 总 结 提示 

° 一 个 试验 中 的 自 变量 ( 因子) 可 以 用 观测 方法 (在 自然 设 定 下 观测 到 的 值 ) 或 者 试验 方法 (出 
试验 者 控制 的 值 ) 测量. 

° 处 理 是 因子 水 平 的 组 合 . 

* 试验 设计 是 一 个 收集 试验 数据 的 计划 (策略 ) , 包括 4 TER: (1) 选择 因子 ; (2) 选择 处 理 ; 
(3) 决定 每 个 处 理 的 样本 容量 ; (4) 把 处 理 指派 给 试验 单位 . 

”增加 容量 设计 通过 仔细 地 挑选 因子 . 处 理 和 样本 容量 来 提取 最 多 的 信息 . 

”减少 干扰 设计 通过 仔细 地 将 处 理 指派 给 试验 单位 消去 试验 中 外 部 信息 源 (于 护 ). 
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e 三 个 基本 试验 设计 : 完全 随机 化 设计 、 随 机 化 区 组 设计 和 析 因 设计 . 
。 完全 随机 化 设计 包含 将 处 理 随 机 指派 给 试验 单位 的 单个 因子 . 
e 随机 化 区 组 设计 是 一 个 包含 处 理 因子 和 区 组 因子 的 减 小 干扰 设计 , 把 处 理 随 机 地 指派 给 每 个 


区 组 中 的 试验 单位 . 
。 析 因 设 计 是 一 个 包含 多 个 因子 的 增加 容量 设计 , 选择 所 有 可 能 的 处 理 (因子 水 平 组 合 ), 并 随 
机 地 指派 给 试验 单位 . 


分 析 来 自 设 计 的 试验 数据 方法 称 为 方差 分 析 . 


补充 应 用 练习 小 时 工资 率 和 工作 日 长 度 都 设置 为 三 个 水 平 , 在 


、 这 些 因 子 的 所 有 水 平 组 合 下 观测 y. 
13.18 试验 中 的 信息 . 怎 量 个 总 体 参 
试验 中 的 信息 . 怎样 度量 有 关 某 个 总 体 参 数 + 这 个 试验 的 类 型 是 什么 ? 


的 样本 中 的 信息 量 ? 型 是 什 4 | 
13.19 NASE 试验 设计 的 哪 一 步 影响 有 关 某 个 š P. 指出 因子 ,并 说 明 它 们 是 定量 的 还 是 定性 的 
总 体 参 数 的 信号 量 ? c. 指出 用 于 试验 的 处 理 . 
13.20 减少 噪声 , 试验 设计 的 哪 一 步 可 能 减少 由 外 13.26 内 燃 机 市 场 份额 . 进行 一 项 研究 ， 比较 用 
部 和 不 受 控制 的 变量 引起 的 变异 ? 两 种 不 同 审核 方法 估计 的 内 燃 机 品牌 的 市 场 


13.21 选择 设计 . 说 明 完全 随机 化 设计 和 随机 化 区 份额 ， 
组 设计 之 间 的 差异 , 在 什么 时 候 随机 化 区 组 设计 a. 指出 试验 中 的 处 理 . 


更 有 利 ? b. 因为 在 估计 市 场 份额 时 品牌 之 间 的 变异 性 , 使 
13.22 HARE. 考虑 两 因子 析 因 试验 , 其 中 一 个 用 随机 区 组 化 设计 . 如 果 研 究 包括 10 种 内 燃 机 

因子 有 两 个 水 平 , 另 一 个 因子 有 4 个 水 平 . 这 个 试 品牌 , 说 明 怎 样 将 处 理 指 派 给 试验 单位 . 

验 包含 多 少 个 处 理 ? 列 出 它们 . : c. 写 出 这 个 随机 化 区 组 设计 的 线性 模型 . 


13.23 完全 析 因 模型 . 写 出 2 x2 x4 析 因 试验 的 完 13.27 灭火 任务 . 研究 者 调查 了 性 别 ( 男 性 或 者 女 
全 因子 模型 , 这 里 两 个 2 水 平 因子 都 是 定量 的 , 第 性 ) 和 体重 ( 轻 或 者 重 ) 对 消防 员 完 成 某 次 灭火 任 
三 个 因子 是 4 水 平 的 定性 因子 . 如 果 试 验 的 重复 次 务 所 需要 的 时 间 长 度 的 影响 (Human Factors, 
数 为 1, 有 几 个 自由 度 可 用 于 估计 o^? 1982). 在 4 个 性 别 -体重 组 合 的 水 平 下 , 选择 8 名 

13.24 无 因子 交互 作用 . 考虑 练习 13.23, 写 出 y 的 消防 员 , 要 求 他 们 执行 某 项 任务 , 记录 每 个 人 完成 
模型 ,假定 模型 仅 包括 因子 的 主 效应 , 但 不 包括 因 任务 所 需 的 时 间 (min). 


子 交互 作用 项 , 有 和 多少 个 自由 度 可 用 于 估计 o^? a. 列 出 试验 中 包含 的 因子 . 
13.25 工人 生产 率 研究 . 假定 计划 研究 小 时 工资 率 b. 对 每 个 因子 , 说明 它 是 定量 的 还 是 定性 的 . 
和 工作 日 长 度 对 工人 生产 率 的 某 种 度量 y 的 影响 ， c. 试验 中 包含 了 多 少 种 处 理 ? 列 出 它们 . 


活动 中 的 统计 学 :加 锌 环 氧 涂 层 的 防腐 行为 

使 用 环 氧 树脂 的 有 机 涂 层 广泛 用 于 防止 钢铁 和 其 他 金属 的 风化 和 腐蚀 . 涂 层 的 抗 腐蚀 性 依赖 于 
几 个 因素 , 包括 涂 层 系统 的 各 种 特性 . 最 近 的 趋势 是 利用 含 锌 粉 或 磷酸 锌 的 环 氧 涂 层 , 这 种 加 锌 环 
氧 涂 层 的 抗 腐蚀 性 被 认为 是 最 有 效 的 . 

国家 技术 大 学 (希腊 雅典 ) 的 材料 科学 与 工程 系 的 研究 员 检 查 了 含有 锌 色素 配方 的 不 同 环 氧 涂 
层 钢铁 的 抗 腐蚀 性 , 试图 找到 具有 最 好 抗 腐蚀 性 的 环 氧 涂 层 . (Pigment & Resin Technology, 32 卷 ， 
2003. ) 试验 材料 ( 即 试验 单位 ) 是 从 含 以 下 成 分 的 钢板 上 切割 下 来 的 撼 形 平板 : (99. 720 ) 、 碳 
(0.06396 )、 锰 (0.022% )、 磷 (0.009% )、 硫 (0. 007% ) ,每 块 平板 涂 上 4 种 不 同 的 涂 层 系统 ( 即 处 
JE) S1, S22, $3, SA 之 一 , 每 种 涂 层 系统 准备 3 HER. (这 些 平 板 标记 为 S1-A, SI-B, SI-C, S2-A, 
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S2-B, .., 84-C) , 4 种 涂 层 系统 的 特征 如 表 SIA13. 1 所 示 . 

每 种 涂 层 平板 浸泡 在 除去 离子 和 空气 的 水 中 , 然后 进行 腐蚀 测试 . 因为 暴露 时 间 对 抗 腐蚀 性 有 
很 大 影响 , 所 以 研究 者 利用 随机 化 区 组 设计 来 尽 可 能 消除 这 种 外 部 变异 源 . 暴露 时 间 ( 即 区 组 ) f] x 
Ay 24h, 60 天 和 120 R. 对 每 个 涂 层 系 统 以 随机 的 顺序 , 使 得 一 块 平板 暴露 在 水 中 24h, 一 块 暴 露 在 
水 里 60 X, 一 块 暴露 在 水 里 120 K, 设计 如 图 SIA13. 1 所 示 . 


表 SIA13.1 4 种 环 氧 涂 层 系统 的 特征 




















涂 层 系统 。 第 1 层 第 2 层 暴露 时 间 | 涂 层 系统 /暴露 的 平板 
51 kad 环 氧 涂料 100 pm J& 24h S1-A,S2-C,S3-C, S4-B 

S2 Benet 环 氧 涂料 100 hm 厚 
S1-C,S2-A,S3-B,S4-A 

$3 带 云母 的 磷酸 锌 ETR 100 pm 厚 
S1-B,S2-B,S3-A,S4-C 

S4 带 云母 的 磷酸 锌 界面 表层 2001um 厚 


图 SIA13.1 随机 化 区 组 设计 表 


枯 露 以 后 ,确定 每 块 平板 腐蚀 率 (nA/em2) ,腐蚀 率 越 低 ， 涂 层 系 统 的 抗 腐蚀 性 就 越 好 . 数据 如 
K SIA13.2 所 示 . 


X SIA13.2 ” 环 氧 涂 层 试验 的 腐蚀 率 
暴露 时 间 系统 Sl 系统 S2 系统 S3 系统 S4 





24 h 6.7 7.5 8.2 6.1 
60 K 8.7 9.1 10.5 8.3 
120 K 11.8 12.6 14.5 11.8 





资料 来 源 : Kouloumbi, N. , et al. “ Anticorrosion performance of epoxy coatings on steel surface exposed to de-ionized water. ” Pigment & 
Resin Technology, Vol.32, No.2 , 2003( 3€ 2. ) 


分 析 这 些 数据 的 恰当 多 重 回归 模型 如 下 : 
E(y) =Bo + Bizi tox) * Bax + Bax, * Bsxs 
环 氧 系统 项 ( 处理) 暴露 时 间 项 (区 组 ) 


其 中 : 
_ [1 如 果 是 系统 Si _ [1 如 果 是 系统 5， 1 如 果 是 系统 S; 
d^ 如 果 不 是 at 如 果 不 是 “= 如 果 不 是 
_ [1 如 果 暴 露 时 间 是 24 小 时 _ [1 如 果 暴 露 时 间 是 60 天 
^ "o 如 果 不 是 s= | 如 果 不 是 


URS si, so, uas, Ls4 分 别 表示 环 氧 系统 S1，S2，S3 ，S4 处 理 ( 总 体 ) 的 平均 腐蚀 率 , 与 处 理 

( 环 氧 涂 层 系统 ) 关 联 的 参数 8 解 释 如 下 : 
Bi = (Msi zus), By = (as - Bs), Bs = (us — sa ) 
RE, 如 果 4 个 处 理 的 均值 之 间 没有 差异 ， BEA. B, =b, = Bs =0. 因此 ， 为 了 确定 处 理 之 间 是 否 存在 
差异 , 检验 Ho: B, =b: =B3 =0 是 适合 的 ， 可 以 用 第 12 SE B OE 来 检验 这 个 假设 . 比较 上 述 
完全 模型 和 简化 模型 ; 
E(y) =Bo + Baxa * Bsxs 
BRNIKA) 
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图 SIA13. 2 给 出 了 分 析 的 SAS 输出 . 在 输出 中 着 重 显示 的 检验 值 为 0.0004, 在 w =0.05, 有 充分 
的 证 据 拒 绝 ,因此 环 氧 处 理 均值 之 间 存 在 差异 . 需要 进一步 分 析 确 定 哪 种 环 氧 涂 层 系统 的 腐蚀 率 最 
低 , 在 第 14 章 我 们 给 出 处 理 均 值 的 评定 方法 . 





Dependent Variable: COHRATE 
Number of Observations Read 12 
Number of Observations Used 12 
finalysis of Variance 
Sum of Mean 
Source DF Squares Square F Value Pr >F 
Model s 72.68833 14.53767 155.30 <.0001 
Error E 0.56157 0.03361 
Corrected Total 11 73.25000 
Root MSE 0.30596 R-Square 9.9923 
Dependent Mean 9.65000 fidj R-Sq 9.9853 
Coeff Var 3.17056 
Parameter Estimates 
Parameter Standard 
Var iable DF Estimate Error t Value Pr > itl 
Intercept 1 11.75833 0.21635 54.35 <. 0001 
81 1 0.33333 0.24381 1.33 0.2305 
82 1 1.00000 0.24981 4.00 0.0071 
83 1 2.33333 0.24981 9.34 <. 0001 
TI 1 -5.55000 0.218535 725.65 «.0001 
T2 1 -3.52500 0.21635 -16.29 <. 0001 
Test TRTMNTS Results for Dependent Var table CDRHATE 
Mean 
Source DF Square F Value Pr >F 
Numerator 3 3.19444 34.12 0.0094 
Denominator 6 9.03361 














图 SIA13.2 ”随机 化 区 组 设计 模型 的 SAS 输出 


(E: 下 面 说 明 利用 合适 的 试验 设计 和 回归 模型 的 重要 性 . 假定 从 模型 中 删除 了 区 组 (暴露 时 间 ) 
项 , 图 SIA13.3 给 出 了 只 有 处 理 ( 环 氧 系 统 项 ) 的 模型 E(y) =po *Bixi +B2x2 +B3x3 的 SAS 输出 . 注意 ， 
检验 Ho: B, =B, =B3 =0 的 p 值 ( 即 整体 F 检验 的 p 值 ) 是 0.7560. 因此 ， 如 果 用 这 个 不 恰当 的 模型 进行 
检验 , 将 得 出 错误 的 结论 , 即 处 理 均值 之 间 不 存在 差异 . ) 














Dependent Variable: CORRATE 
Number of Observations Read 12 
Number of Observations Used 12 
finalysis of Variance 
Sun of Mean secs 
Source bF Squares Square F Value Pr GE 
Model 3 3.58333 3.19444 0.40 D. 7566 
Error 8 53.66667 7.95833 
Corrected Total 11 73.25000 
Root MSE 2.82105 R-8quare 0.1308 
Dependent Mean 3.65000 fidj R-Sq -0.1951 
Coeff Var 29.23370 
Parameter Estimates 
Parameter Standard 
Variable DF Estimate Error t Value Pr > [t| 
Intercept 1 8.73333 1.82874 5.36 0.0007 
81 1 0.33333 2.30338 0.14 0.8885 
s? 1 1.00000 2.30338 0.43 0.6757 
83 1 2.33333 2.30338 1.01 0.3407 
T 
图 SIA13.3 ”只 有 处 理 效应 的 模型 的 SAS 输出 


第 14 章 ”试验 设计 的 方差 分 析 


目标 为 了 比较 2 个 或 多 个 总 体 均 值 ,， 本 章 将 介绍 一 种 分 析 从 经 设计 的 试验 中 收集 到 的 数据 的 
方法 ; 确定 方差 分 析 与 回归 分 析 的 关系 ,并 给 出 它们 共有 的 特征 . 


14. 1 引言 


一 旦 收集 到 经 设计 的 试验 数据 , 就 用 这 些 样本 信息 对 与 各 种 处 理 相 联系 的 总 体 均值 进行 推断 . 
用 于 比较 处 理 均值 的 方法 传统 上 叫做 方差 分 析 或 者 ANOVA , 方差 分 析 过 程 提 供 了 一 系列 公式 , 用 来 
计算 进行 这 些 推断 所 需要 的 检验 统计 量 及 置信 区 间 . 

这 些 对 每 个 试验 设计 的 一 套 公式 于 20 世纪 初 在 计算 机 发 明之 前 就 已 提出 , 尽管 这 些 公式 计算 
相当 单调 乏味 , 但 便于 应 用 . 回忆 第 13 章 与 每 个 试验 设计 相 联系 的 线性 模型 ,利用 回归 分 析 和 计算 
机 对 模型 进行 恰当 分 析 所 得 到 的 推断 与 用 ANOVA 计算 公式 得 到 的 推断 是 相同 的 . 

在 本 章 中 , 主要 焦点 是 用 回归 方法 分 析 来 自 设计 的 试验 数据 . 分 析 几 种 常见 的 试验 设计 ( 其 中 一 
些 已 经 在 第 13 章 中 给 出 )， 此 外 ,还 介绍 每 种 设计 的 ANOVA 计算 公式 , 并 给 出 它们 与 回归 分 析 的 关 
系 . 在 14.2 节 首先 介绍 支持 方差 分 析 和 这 些 公式 的 逻辑 


14.2 ”方差 分 析 中 的 逻辑 


我 们 用 下 面 简单 的 例子 来 解释 支持 方差 分 析 的 概念 . 

考虑 一 个 两 水 平 ( 即 两 种 处 理 ) 单 因子 试验 . 假定 我 们 想 根据 两 个 独立 随机 样本 的 均值 来 决定 两 
种 处 理 的 均值 是 否 不 同 , 其 中 每 个 样本 包含 nl =n, =5 个 观测 值 , y 值 在 图 14.1 中 给 出 . 注意 左边 的 
5 个 圈 是 由 样本 1 B) y 值 画 出 的 , 右边 的 5 个 实心 点 是 由 样本 2 BJ y 值 画 出 的 . 再 观察 通过 两 个 样本 
均值 My 的 水 平 线 , 你 认为 图 中 给 出 了 足够 的 证 据 表 明 对 应 的 总 体 均 值 间 存 在 差异 吗 ? 

如 果 对 图 14.1 中 的 数据 不 能 确定 总 体 均值 是 否 不 同 , 检查 图 14. 2a 中 两 个 不 同 的 样本 . 我 们 认 
为 对 这 些 数据 将 赞成 总 体 均值 是 不 同 的 . 检查 图 14. 2b 给 出 的 第 三 种 情况 ， 对 这 些 数据 ,总体 均 值 之 
间 似 乎 只 有 一 点 或 没有 不 同 . ; 

直观 地 利用 了 图 14. 1 和 图 14. 2 的 什么 元 素来 确定 数据 是 否 表 
明 总 体 均值 间 存 在 不 同 ? 这 个 问题 的 答案 是 从 视觉 上 比较 样本 均值 
之 问 的 距离 (变异 ) 与 两 个 样本 中 的 每 一 个 样本 y 值 内 的 变异 . 

因为 图 14. 2a 中 样本 均值 的 差异 相对 于 样本 内 的 变异 是 大 的 . 
我 们 推断 总 体 均 值 是 不 同 的 . 相反 地 , 在 图 14.2b rh, 样本 均值 间 的 
变异 相对 于 样本 内 的 变异 较 小 , 因此 表示 均值 显著 不 同 的 证 据 很 少 : 

对 9.7 节 独 立 随机 样本 T 检 验 , 由 计算 合并 的 2 来 度量 样本 
内 的 变异 ， 即 样本 1 样本 2 


" m 图 14.1 两 样本 图 
>. (ya 一 万 )2 + > (yo - y. )2 SSE 
i=1 i=l 


n + n, 一 2 ^ni +n, -2 


CO — tS G £ LAC -10 Oc 
I 
i 
° 090 lo 
I 
! 
bg 
LI 
Sej 











“样本 内 变异 : s2 = 
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图 14.2 两 种 情况 的 数据 图 


其 中 ya 是 样本 1 的 第 i 个 观测 值 , yz 是 样本 2 的 第 i 个 观测 值 . s? 的 分 子 常 记 为 SSE， 即 误差 平方 
和 . 正如 回归 分 析 , SSE 度量 的 是 未 被 解释 的 变异 性 , 但 是 在 这 种 情况 , 它 度量 的 是 不 能 用 样本 均值 
间 的 差异 来 解释 的 变异 性 . 

样本 间 变 蜡 的 度量 由 单个 样本 均值 关于 所 有 10 个 观测 值 的 均值 7 的 加 权 离 差 平方 和 除 以 样本 


数 减 1 给 出 , BJ 
站 mi-y)?*nmG,-») SST 
样本 间 变 异 : 2-1 = 1 
分 子 中 的 量 记 为 SST, 即 处 理 平方 和 ,由 于 它 度 量 的 是 由 两 个 处 理 样 本 均值 之 间 的 差异 解释 的 变 
异性 . 
对 这 个 试验 设计 ,SSE 和 SST 合计 为 已 知 的 总 和 ， 即 
SS( 总 ) = Z (y, -7)? 


(k: SS( 总 ) 等 价 于 回归 中 的 SS,,). 另外 , 比 忆 = 样本 间 变 异 /样本 内 变异 = Sa 一 
1 27 


服从 自由 度 (df) 为 v1 21, v; =n +n, -2 BL F 2r, 因此 可 用 于 检验 处 理 间 无 差异 的 原 假设 . 平 
方 和 的 可 加 性 致使 早期 研究 人 员 将 这 个 分 析 看 作 SS( 总 ) = X (y; - y) ?分解 为 相应 于 包含 在 试验 
中 因子 及 SSE 来 源 . 这 个 计算 平方 和 的 简单 公式 , 可 加 性 及 检验 统计 量 的 形式 自然 地 称 这 个 程序 
为 方差 分 析 . 将 在 14.3 ~ 14.7 节 演 示 方 差分 析 过 程 以 及 它 与 几 种 常见 试验 设计 的 回归 关系 . 


14.3 单 因 子 完全 随机 化 设计 


回忆 (13.2 节 ) 设 计 一 个 试验 的 前 两 步 : (1) 确定 调查 的 因子 ;(2) 选择 包含 试验 的 因子 水 平 组 
fr CREE). 例如 , 假定 希望 得 到 在 某 加 工 操作 中 完成 三 个 培训 计划 A、B 和 C 之 一 的 工人 装配 一 种 设 
备 所 需 的 时 间 长 度 , 那么 这 个 试验 包括 单个 因子 培训 计划 , 有 三 个 水 平 A. BAC 因为 培训 是 唯一 
WAF, 所 以 这 些 水 平 (A、B 和 C) 表 示 处 理 . 现在 必须 决定 每 个 处 理 的 样本 大 小 (第 3 步 ), 并 解决 
如 何 将 处 理 指派 到 各 试验 单位 , 即 指定 的 工人 (第 4 步 ). 

在 学 习 第 13 章 时 , 将 处 理 指派 给 试验 单位 最 常用 的 是 完全 随机 化 设计 . 举例 说 明 , 假定 希望 得 
到 三 种 培训 计划 的 平均 装配 时 间 的 相等 信息 量 , 即 决定 指派 相等 数量 的 工人 到 三 个 培训 计划 中 的 每 
一 个 , HE, 假定 确定 这 三 个 样本 中 每 个 样本 的 工人 人 数 为 mm = n, = n4 =10. 那么 完全 随机 化 设计 
就 是 随机 指派 30 个 工人 . 每 个 处 理 中 指派 10 名 工人 . 随机 指派 是 任意 一 次 指派 与 任意 其 他 指派 是 等 
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可 能 的 . 这 就 消去 了 以 某 种 系统 方法 指派 工人 时 可 能 发 生 的 偏见 . 例如 , 系统 指派 可 能 偶然 地 将 大 多 
数 熟 练 灵 巧 的 工人 指派 到 计划 A, 因此 低估 了 相应 于 A 的 真实 平均 装配 时 间 . 

例 14.1 阐述 了 如 何 用 随机 数 发 生 器 将 30 名 工人 指派 到 三 个 处 理 中 . 
用 表 B. 1 的 随机 数 表 , 指派 n 230 个 试验 单位 到 三 个 处 理 组 中 . 

解 第 一 步 是 将 30 名 工人 从 1 ~30 编号 , 然后 利用 表 B. 1 选择 两 位 数字 , 舍弃 那些 大 于 30 或 
相等 的 , 直到 一 共有 20 个 两 位 数字 , 这 样 有 了 依 随机 次 序 排列 的 20 个 1 ~ 30 之 间 的 整数 . 被 指派 为 
序列 中 前 10 个 数字 的 工人 指派 到 计划 A, 第 二 组 的 10 个 工人 指派 到 计划 B H, 其 余 的 工人 指派 到 
计划 C ih. 

举例 说 明 , 假定 以 表 1 中 第 5 行 第 6 列 的 两 位 随机 数字 开始 , 沿 着 这 列 向 下 ,只 选择 小 于 等 于 30 


的 两 位 数字 (前 两 个 数字 ), 并 删除 重复 的 . 前 20 表 14.1 随机 指派 工人 到 处 理 
个 数 为 : 20,18,13,16,19,04,14,06,30,25,27,17, A B c 





24,21,22,02,15,05,09,08. 将 具有 前 10 个 编号 的 20,18 ,13,16,19， 27,17,24,21,22， 1,3,7,10,11, 
工人 指派 到 计划 A, 接 下 来 的 10 名 指派 到 B, RTF 4,14,6,30,25 2,15,5,9,8 — 12,23,26,28 29 
的 10 名 指派 到 C. 指派 到 培训 计划 的 工人 如 表 14.1 一 一 一 一 一 一 一 一 一 一 一 一 一 一 
所 示 . 

在 某 些 试验 情况 下 ， 由 于 试验 单位 本 身 的 性 质 我 们 不 能 将 处 理 随 机 地 指派 给 试验 单位 . 例如 ， 
Journal of Testing and Evaluation(1992 年 7 月 ) 记 述 了 一 个 比较 5 种 不 同 大 小 的 瓦楞 纸 装 运 箱 平 均 抗 
压强 度 (了 b) 的 研究 , 箱子 的 大 小 (标记 为 A. B. C. D 和 下 ) 是 试验 的 处 理 . 然而 , 这 些 处 理 不 能 “ 指 
派 "给 瓦楞 纸 装 运 箱 ( 试验 单位 ) , 一 个 纸 装 运 箱 的 大 小 为 A 或 B 等 ; 换言之 , 一 个 装运 箱 已 经 有 一 
个 大 小 , 不 能 随机 指派 给 一 个 处 理 了 . 相反 ， 我 们 将 这 些 处 理 (箱子 的 大 小 ) 看 作 从 中 选择 试验 单位 
(装运 箱 ) 的 独立 随机 样本 的 总 体 . 

一 个 完全 随机 化 设计 包含 p 个 处 理 的 均值 比较 ,基于 分 别 取 自 与 处 理 1 2,75, 了 关联 的 总 体 的 
ni, na, n, 个 观测 值 的 独立 随机 样本 . 用 这 个 修正 重新 给 出 完全 随机 化 设计 的 定义 (已 在 13.4 节 
给 出 ), 完全 随机 化 设计 的 一 般 安排 在 图 14.3 中 给 出 . 














处 理 1 处 理 2 °°. 外 理 p 
M ` °... bd 
° . ° 
观测 ni 个 y f 观测 有 个 y f 观测 区 个 y 值 


图 14.3 完全 随机 化 设计 的 安排 


定义 14.1 比较 p 个 处 理 均值 的 完全 随机 化 设计 是 将 处 理 随 机 指派 给 试验 单位 ， 或 从 个 总 
中 的 每 一 个 抽取 的 独立 随机 样本 . 

在 收集 完全 随机 化 设计 的 数据 后 , 要 对 p 个 总 体 的 均值 Li 进行 推断 , 其 中 是 与 处 理 i 关联 的 
测量 值 总 体 的 均值 , i =1, 2,…, p. 要 检验 的 原 假设 是 p 个 处 理 的 均值 相等 , 即 Hyg =M =" =M. 
我 们 希望 检验 的 备 择 假设 是 至 少 有 两 个 处 理 的 均值 不 同 . 对 于 响应 y, 恰 当 的 线性 模型 为 
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E(y) = Bo *Bixi +B2x2 ++ * B, iX, -1 


1 如 果 是 处 理 2 1 ”如 果 是 处 理 3 1 如 果 是 处 理 p 
^o 如 果 不 是 i lo 如 果 不 是 MEN lo 如 果 不 是 
且 ( 任 意 地 ) 处 理 1 为 基准 水 平 . 回忆 这 个 0 - 1 编码 系统 意味 着 

Bo = 
Bi =u - ua 
B> =s -4 


B, 1 Hp TH 
了 个 总 体 均值 相等 的 原 假设 等 价 于 所 有 处 理 的 差 为 0 的 原 假设 , BH 
Ho:B1 285 =……=B,_1=0 
为 了 利用 回归 检验 这 个 假设 , 我 们 用 12.8 节 中 的 方法 ; 即 比较 调 套 简化 模型 
E(y) 2f 
的 误差 平方 和 SSE: 和 完全 模型 
E(y) =Bo * Byx, * Bax; +: * B, -1%p-1 
的 误差 平方 和 SSECG, 用 正统 计量; 
~ (SE, -SSEc)/Ho 中 有 参数 的 个 数 _ (SSEr -SSEc)/(p-1) (SSEr -SSEc)/(p-1) 
”SSEc/[n - 完全 模型 中 参数 的 个 数 ] ” — SSEcZ(n - p) MSEc 
其 中 下 是 基于 wm = (p-1)# = (n — p) B HE. 如 果 超过 了 上 侧 临 界 值 F., 那么 拒绝 H, 得 出 
至 少 有 一 个 处 理 的 差 pi, B,,，…， B, -1 不 为 0, 即 推断 出 至 少 有 两 个 处 理 的 均值 不 同 . 
证 明 : 在 完全 随机 化 设计 中 检验 处 理 均值 相等 性 的 正统 计量 等 价 于 完全 模型 的 全 局 下 
检验 . 
解 ” 因 为 简化 模型 只 包含 Bo 项 , Bo 的 最 小 二 乘 估 计 是 7， 所 以 
SSER = X(y-y)? -SS,, 
我 们 在 第 12 章 中 称 这 个 量 为 总 平方 和 . 对 于 完全 模型 ， 差 (SSEr -SSEc ) 就 是 (SS,, — SSE). 由 于 在 
EIH, (SS, ~ SSE) = SS( 模 型 ), 完全 模型 有 (p -1) 项 (不 包括 Bo)， 
=-(SSEr -SSEc)/(p -1) _ ss( 模 型 )/(p -1) _ MS( 模 型 ) 
MSE, MSE MSE 
因此 , 在 完全 随机 化 设计 中 检验 原 假设 








Ho: pi uj = 
的 检验 统计 量 与 检验 这 个 设计 的 完全 模型 的 全 局 效用 的 五 统计 量 是 相同 的 . 
分 析 来 自 完全 随机 化 设计 的 数据 的 回归 方法 ， 总 结 在 下 面 . 注意 检验 要 求 一 些 关 于 p 个 处 理 的 
响应 y 的 分 布 假定 ， 而 且 不 管 样本 大 小 这 些 假定 都 是 必须 的 . (在 14. 9 节 中 会 给 出 这 些 假定 更 多 的 
说 明 . ) 
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PpP 个 处 理 的 完全 随机 化 设计 的 模型 和 F bue 
完全 模型 :E(y) =Bo +Bix1 t Box; + B, Bua 


其 中 
Spo 如 果 是 处 理 2 jl 如 果 是 处 理 3 — . 4 如 果 是 处 理 p 
-fo 如 果 不 是 := 如 果 不 是 Pl l0 如 果 不 是 
Hy: By 2 Bo = =B, -1 =0( E Ho:p =p2 =: =p) 


H, Ho 中 的 BB 参数 至 少 有 一 个 不 等 于 0( 即 有 :至 少 两 个 均值 不 等 ) 


检验 统计 量 : r -SRE 
拒绝 域 : F>F,, 3 F E ËB BE 3 v =p~1 和 w=(n-p) 的 下 分 布 . 
假定 : 1. 所 有 相应 于 p 个 处 理 的 p 个 总 体 的 概率 分 布 是 正 态 的 . 

2. p 个 处 理 的 总 体 方差 是 相间 的 . 











进行 一 次 试验 ,， 当 缓慢 旋转 的 布 面 轮子 受到 磨损 时 ， 比较 三 种 涂料 的 磨损 量 . 对 








每 种 涂料 类 型 试验 10 个 涂料 样品 , 记录 每 个 样品 表 14.2 三 种 涂料 的 磨损 数据 
直至 出 现 可 见 磨损 时 的 小 时 数 , 数据 (及 总 和 ) 在 涂料 类 型 
X 14.2 中 给 出 . 是 否 有 充分 的 证 据 表明 3 种 涂料 1 2 3 
直至 磨损 明显 可 见 时 的 平均 时 间 存在 差异 ? 用 a= 148 513 335 
0.05 检验 . 76 264 643 

解 试验 包含 一 个 三 水 平 的 因子 涂料 类 型 . 因 393 433 216 
此 ， 是 p =3 个 处 理 的 完全 随机 化 设计 . KZ ， H2 520 94 536 
和 js 分 别 代表 1,2,3 型 涂料 的 平均 磨损 时 间 ，, 那 236 535 128 
么 想 要 检验 134 327 723 

Ho: A =i = Ma 55 214 258 

对 备 择 假设 166 135 380 

H,: 三 个 均值 中 至 少 两 个 不 同 415 280 594 
Xf p 23 个 处 理 的 适当 线性 模型 为 : 153 304 465 

完全 模型 : E(y) =B tix, * Bx, 样本 均值 ，  »,-229.6  y,-309.9 J, =427.8 
其 中 ， 

x) = [. 如 果 是 1 型 涂料 nc f 如 果 是 2 型 涂料 
0 ”如 果 不 是 ? lo ”如果 不 是 


因此 ,我 们 要 检验 Ho: B, =p, =0. 

完全 模型 的 MINITAB 回归 分 析 在 图 14.4 中 给 出 . 检验 模型 整体 恰当 性 的 下 统计 量 为 (输出 中 的 
阴影 部 分 )F =3.48, 其 中 下 分 布 是 基于 自由 度 为 v=(p-1)=3-1=2 和 w=(n-p)=30-3=27 
的 分 布 . 对 a =0.05, 临界 值 (由 表 B. 10 得 到 ) 为 Fo os =3.35( 见 图 14.5). 

AAAH F (8 3.48 超出 了 临界 值 Foos =3.35, 所 以 拒绝 印 ,并 推断 (在 显著 性 水 平 w =0.05 
时 ) 三 种 涂料 中 至 少 有 两 种 明显 磨损 的 平均 时 间 是 不 同 的 . 注意 a =0.05 大 于 输出 中 阴影 部 分 的 p f& 
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(0.045) , 由 此 可 以 得 到 相同 的 结论 . 


Regression Analysis: HOURS versus X1, X2 fu 
A 





The regression equation is 
HOURS = 428 - 198 X1 - 118 X2 






Predictor Coef SE Coef T P 
Constant 427.80 53.43 8.01 0.000 
X1 -198.20 75.56 -2.62 0.014 
x2 -117.90 75.56 -1.56 0.130 
S - 168.948 R-Sq = 20.5% R-Sq(adj) = 14.65 


aœ = 0.05 


Analysis of Variance 




















Source DF SS MS F P 0 l 2 3 4 5 6 j 
Regression 2 198772 99386 3.48 20.045 | ` | 
Residual Error 27? 770671 28543 拒绝 域 
Total 29 969443 3.35 
图 14.4 例 14.3 完全 随机 化 图 14.5 例 14.3 的 拒绝 域 ; 分 子 自 由 度 =2， 
设计 的 MINITAB 回归 输出 分 母 自由 度 =27, a =0.05 


例 14.3 中 的 数据 的 分 析 也 可 以 由 ANOVA 计算 公式 完成 . 在 14.2 节 中 , 知道 方差 分 析 将 SS( 总 ) = 
Ey-y) 分 解 为 两 部 分 : SSE 和 SST( 见 图 14.6). aswan 

回忆 量 SST 表示 处 理 平方 和 , 度量 由 处 理 均值 间 闫 | 
异 解释 的 变异 . 误差 平方 和 SSE 是 不 能 由 计算 的 p 个 样 | STES « 
本 内 合并 的 变异 性 度量 得 到 解释 的 变异 性 度量 . 如 果 处 
理 均值 真 的 不 同 , 那么 SSE 应 在 实质 上 小 于 SST. 用 正统 
计量 比较 两 个 变异 来 源 : 图 14.6 完全 随机 化 设计 的 SS( 总 ) 的 分 解 
SST/(p-1) _ MST 
SSE/ (n - p) ^ MSE 
其 中 是 测量 值 的 总 个 数 . F BRAF MST = SST/(p - 1) 表示 处 理 均 方 , 自由 度 为 (p -1)(p + 
处 理 的 每 一 个 减 去 一 个 总 平均 的 估计 ) , 正统 计量 的 分 母 MSE = SSE/(n - p) 表示 误差 均 方 , 自由 度 
为 (n-p) (n 个 测量 值 的 每 一 个 减 去 p 个 估计 ) 的 处 理 均值 的 每 一 个 . 已 经 证 明 这 个 正统 计量 与 较 时 
指定 的 回归 模型 全 局 严 值 是 相同 的 . 

为 了 完整 性 ,下 面 框 格 中 给 出 方差 分 析 的 计算 公式 . 























误差 平方 和 SSE 








F = 








完全 随机 化 设计 的 ANOVA 计算 公式 
所 有 nn 个 测量 值 的 和 = y> 
所 有 nn 个 测量 值 的 平均 -7 
所 有 n 个 测量 值 的 平方 和 = > 


CM = 均值 的 修正 (所 有 观测 值 的 和 )? _ (à?) 


观测 值 的 总 个 数 n 
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SS( 总 ) = 总 平方 和 = (所 有 观测 值 的 平方 和 ) -CM = Y -CM 


SST = 处 理 平方 和 =( 每 个 处 理 内 观测 值 的 平方 和 除 以 那个 处 理 的 观测 值 个 数 之 总 和 ) -CM 
ON NEN 
= 一 + 一 +…+ 一 -CM 


n n, ny 
SSE = 误差 平方 和 =SS( 总 ) -SST 
MST = 处 理 均 方 = 


MSE = e 





EER 29]1423, 用 ANOVA 方法 分 析 表 14.2 中 的 数据 , JH a = 0.05. 

解 ” 由 于 执行 手 算 单调 乏味 (把 这 个 作为 练习 留 给 学 生 ). 借助 一 个 统计 软件 包 . 

EXCEL ANOVA 的 输出 在 图 14.7 中 给 出 , 检验 统计 量 的 值 (输出 的 阴影 部 分 ) 为 =3.48. 注意 
这 与 例 14.3 中 由 回归 方法 得 到 的 下 值 是 一 样 的 . 检验 的 p 值 (也 是 阴影 部 分 ) 为 p =0.045. (同样 地 ， 
这 个 量 也 与 例 14.3 中 一 样 ). 因为 a=0.05 超过 了 p 值 , 所 以 有 足够 的 理由 推断 处 理 间 有 差异 . 






Count | Sum _ Average Variance 
1ü 2298 2298 25026.04 
10 3089 309.9. 21866.77 
10 4278 4278 3973729 





onio nein E — ——— — —— — — X 
ource of Variation SS df MS F  Pweue F cri 

12 Between Groups 198772.5 2 9938823 3481938 0.045159 3354131 

| Within Groups 770670 9 27 2854337 


Dd 





而 | [Total 969443 4 29 


图 14.7 4514.4 完全 随机 化 设计 的 EXCEL ANOVA 输出 


方差 分 析 的 结果 常 汇总 成 列表 形式 . 完全 随机 化 设计 ANOVA 表 的 一 般 形式 在 下 面 框 格 中 给 出 . 
表 头 来 源 表示 变异 来 源 , 对 每 个 来 源 , DF 表示 自由 度 ，SS 为 平方 和 ，MS 表示 均 方 , F 表示 比较 处 
理 均 方 与 误差 均 方 的 刁 统 计量 . 表 14.3 是 相应 于 由 EXCEL 输出 的 例 14.4 数据 方差 分 析 的 ANOVA 


表 14.3 例 14.4 的 ANOVA 汇总 表 





来 源 df SS MS F 
涂料 类 型 2 198 772 99 386 3.48 
误差 27 770671 28 543 


总 和 29 969 443 
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完全 随机 化 设计 的 ANOVA 汇总 表 








一 旦 由 ANVOA 确定 处 理 均值 之 间 有 差异 , 对 均值 由 小 到 大 排列 是 很 重要 的 . ANOVA 中 处 理 均 


值 排序 的 两 个 有 用 方法 在 14.8 节 给 出 . 
应 用 练习 


14.1 K. K 3 GE H 69) 5E PE. Journal of Testing and 
Evaluation( 1992 年 7 月 JERIT- RATELE 
运 箱 平均 抗 压强 度 的 研究 . 对 5 种 不 同型 号 (A、B、 
C.D 入) 的 箱子 进行 比较 , 每 种 型 号 各 取 20 个 相 
同 的 箱子 参加 测试 , 并 记 下 每 个 箱子 能 承受 的 最 
KEJ b). 附 图 给 出 5 种 型 号 箱子 的 样本 均值 和 
围绕 每 个 样本 均值 的 变异 . 


1 000 
900 — 
800 - I 


对 


600 — 





抗 压强 度 
è 2 
o o 
T T 
me 











100 
ol l | 1 L Lo 
A B C D E 
盒子 类 型 
资料 来 源 ; Singh, S. P. et al.“ Compression of single-wall 
corrugated shipping containers using fixed and floating test 


platens. ", Journal of Testing. and Evaluation. Vol. 20,No.4, 
July 1992 ,p. 319( [d 3). 


a. 解释 为 什么 作为 一 个 完全 随机 化 设计 收集 数据 . 

b. 关于 B 和 D 型 箱子 . 根据 图 , 这 两 种 箱子 的 平 
均 抗 压强 度 是 否 呈现 出 显著 差别 ? 并 解释 . 

c. 根据 图 , 这 5 种 箱子 的 平均 抗 压强 度 是 否 呈 现 
出 显著 差别 ? 并 解释 . 

14.2 弹性 工作 时 间 表 . 参考 练习 13.2 的 完全 随机 

化 设计 . 回忆 研究 人 员 想 比较 三 种 不 同 工 作 时 间 表 

的 工人 的 平均 职业 满意 程度 : 弹性 上 班 时 间 、 错 开 


起 始 上 班 时 间 以 及 固定 上 班 时 间 . 用 随机 数 表 ( 表 
B. 1) 将 工人 随机 地 指派 到 这 三 种 工作 时 间 表 . 


14.3 $89 54 3i 855-3]. Trends in Biomaterials & Arti- 


ficial Organs (2003 年 1 月 ) 发 表 一 篇 关于 新 的 牙齿 

SECORMIBI2E. 这 种 黏合 剂 ( 称 为 “智能 黏合 剂 ”) 

的 进步 在 于 消除 了 必需 的 干燥 区 域 . 作为 研究 的 一 

部 分 , 将 30 个 用 智能 黏合 的 拔牙 者 随机 指派 三 种 

不 同 的 黏合 时 间 : 1 h. 24 h 或 48 h. 在 黏合 期 结束 

时 , 测定 每 颗 牙 齿 的 折断 强度 (单位 : MPa). 为 确 

定 新 黏合 剂 的 真实 平均 折断 强度 的 不 同 是 否 依赖 

黏合 时 间 , 我 们 用 方差 分 析 方 法 分 析 得 到 的 数据 . 

a. 确定 这 个 完全 随机 化 设计 的 试验 单位 , 处 理 和 
响应 变量 . 

b. 提出 ANOVA 的 原 假设 和 备 择 假 设 . 

c. šK a =0.01 时 检验 的 拒绝 域 . 

d. 若 检验 结果 下 =61.62, H p f 0, 给 出 这 个 检 
验 适 当 的 结论 . 

e. 为 了 检验 结果 是 有 效 的 , 要 求 什么 条 件 ? 


14.4 训练 机 器 人 像 蚂 蚁 一 样 表现 . 机 器 人 研究 人 员 


调查 机 器 人 是 否 可 以 被 训练 得 像 在 群落 中 蚂蚁 一 

样 表现 (Nature, 2000 年 8 月 ). 训练 机 器 人 并 将 它 

们 随机 指派 到 包含 3, 6, 9 或 12 个 机 器 人 群落 中 

( 即 组 ). 指派 机 器 人 寻找 “食物 ”的 任务 , 并 当 它 们 

确认 一 个 资源 富足 地 区 时 增 派 其 他 机 器 人 . 试验 的 

一 个 目的 是 比较 4 个 大 小 不 同 的 群落 (每 个 机 器 

人 ) 平 均 花 费 的 能 量 . 

a. 所 用 的 试验 设计 类 型 是 什么 ? 

b. 指出 处 理 和 因 变 量 . 

c. 提出 检验 的 原 假设 和 备 择 假设 . 

d. 报告 的 ANOVA 结果 如 下 : F=7.70, 分 子 自由 
度 =3, 分 母 自由 度 =56, p f «0 .001. 在 显著 
性 水 平 a =0.05 进行 检验 并 解释 结果 . 
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14.5 核电 厂 的 安全 性 . American Journal of Polotical 
Science( 1998 年 1 月 ) 的 一 篇 文章 , 调查 三 组 影响 
美国 政策 的 专业 人 员 的 态度 . 对 100 名 科学 家 、100 
名 记者 和 100 名 政府 官员 的 随机 样本 询问 核电 厂 
的 安全 性 . 响应 为 7 分 制 , 其 中 1 = 非常 不 安全 ， 
7= 非 常安 全 , 这些 组 的 平均 安全 性 得 分 是 : 科学 
家 4.1; 记者 3.7; 政府 官员 4.2. 

a. 指出 这 个 研究 的 响应 变量 。 

b. 这 项 研究 中 包含 多 少 个 处 理 ? 描述 它们 . 

c， 给 出 用 于 调查 科学 家 、 记 者 和 政府 官员 考虑 核电 厂 
安全 性 的 态度 是 否 存 在 差别 的 原 假设 和 备 择 假设 . 

d. 样本 数据 的 MSE 为 2.355. 为 拒绝 c 中 检验 的 原 
假设 , MST 至 少 需 多 大 ? Hoa 0.05. 


e. 如 果 MST 211.208, c 中 检验 的 近似 p 值 是 多 少 ? 
14.6 ”燃气 轮机 的 冷却 方法 。 参 考 练习 8.33, Jour- 

nal of Engineering for Gas Turbines and Power (2005 

年 1 月 ) 就 高 压 雾 状 人 风 燃 气 轮机 的 研究 . 回忆 研 

究 人 员 将 燃气 轮机 分 为 三 类 (传统 的 、 高 级 的 、 航 

改 燃气 轮机 ) 并 测量 每 种 类 型 抽样 的 燃气 轮机 热 耗 

XE(KJ/kW * h) ,用 完全 随机 化 设计 ANOVA 分 析 

GASTURBINE 文 件 中 的 数据 , 结果 如 MINITAB 输 

出 所 示 . 

a. 陈述 ANOVA 下 检验 的 原 假设 和 备 择 假 设 . 

b. 给 出 检验 统计 量 的 值 以 及 相应 的 p 值 . 

c. 是 否 有 充分 的 证 据说 明 三 种 燃气 轮机 的 平均 热 

耗 率 之 间 存 在 差别 ? 用 a =0.01 检验 . 








Source DF SS MS 
ENGINE 2 55360022 27680011 
Error 64 112537186 1758394 
Total 66 167897208 


S= 1326 | R-Sq = 32.975 


15.74 


R-Sqiadj) 


Individual 95 CIs For Mean Based on 


One-way ANOVA: HEATRATE versus ENGINE 


F P 
0.000 


= 30.885 


Pooled StDev 


Pooled StDev - 1326 





Level N Mean StDev  ---4--------- T--------- T--------- T------ 
Advanced 21 9764 639  (---*----) 
Aeroderiv ? 12312 2652 (-------- 让 一 一 一 一 一 一 一 ) 
Traditional 39 11544 1279 (--*-—-) 
-T--—4--------- T--------- 4--------- 4------ 
9600 10800 12000 13200 








练习 14.6 的 MINITAB 输出 


14.7 高 强度 铝 合金 . BHAY 7.31, JOM (2003 年 
1 月 ) 研 究 一 种 用 于 反潜 飞艇 、 坦克 、 AAEREN 


Te 


给 出 一 个 适合 于 用 回归 方法 分 析 数 据 的 线性 模型 . 
.用 a 中 模型 拟 合 数据 ,并 进行 分 析 , 将 分 析 结 果 


新 的 高 强度 铝 合金 . 回忆 这 种 新 的 合金 是 用 当前 最 
大 强度 的 铝 合 金 反 复 退 化 和 老化 (RAA ) 热处理 方 
法 得 到 的 . 对 三 种 新 的 RAA 合金 和 三 种 当前 最 大 
强度 的 合金 进行 强度 测试 , 得 到 的 强度 结果 (单位 : 
MPa) 在 下 表 给 出 . 





当前 (1) RAA(2) 
604 662 
595 624 
580 637 


列 在 ANOVA 表 中 ， 

用 ANOVA 公式 计算 数据 的 MST, 由 这 个 量度 量 
的 是 什么 类 型 变异 性 ?这 个 值 与 b 中 ANOVA 表 
的 MST 一 致 吗 ? 

.用 ANOVA 公式 计算 数据 的 MSE ,由 这 个 量度 量 
的 是 什么 类 型 变异 性 ? 这 个 值 与 b 中 ANOVA 表 
的 MSE 一 致 吗 ? 

MST 的 自由 度 是 多 少 ? 

ft MSE 的 自由 度 是 多 少 ? 

计算 适合 于 检验 Hu =u, 对 两 个 处 理 均值 不 
同 的 备 择 假设 检验 统计 量 , 取 显 著 性 水 平 a = 


p 


£g 


e 


qs 


548 


第 14 £ 





0.05. (5j b 中 用 回归 得 到 的 检验 统计 量 的 值 相 
比较 . ) 

h. 指出 取 显 著 性 水 平 w =0. 05 的 拒绝 域 . 

i 用 该 问题 的 语言 陈述 适当 的 推断 . 

j 用 8.7 节 独 立 样本 的 学 生 了 检验 检验 H, jy = 
对 备 择 假设 已 :上 =u, H oa = 0.05 检验 . 

k. 可 以 证 明 ( 证 明 略 ) 分 子 自 由 度 v =1, 分 母 自由 
E o, 的 正统 计量 等 于 了, 其 中 了 是 基于 自由 度 
为 的 学 生 了 统计 量 . 将 j 中 计算 的 T 值 平方 ， 
并 证 明 它 等 于 g 中 计算 的 下 值 . 

L 比较 两 个 总 体 均 值 的 方差 分 析 下 检验 是 H,: u, = 
jp 的 单 侧 检 验 , 还 是 双 侧 检验 ? (提示 : 虽然 7 
检验 可 用 于 检验 :pw >u, 3X Hg <pw, 但 F 
检验 的 备 择 假设 为 H: 两 个 均值 不 同 . ) 

14.8 基于 虚拟 现实 的 复原 系统 . 利用 虚拟 现实 

(VBR) 技术 的 手 复原 系统 已 经 为 手 及 手臂 丧失 能 力 

的 病人 所 使 用 . 在 Robotica( VoL. 22, 2004) ,机 械 

和 系统 工程 师 评 估 三 种 基于 VR 的 手 复原 系统 显示 

设备 的 有 效 性 . 系统 A 利用 投影 仪 操 纵 VR 模拟 ， 

系统 B 用 台式 计算 机 监视 仪 ,系统 C 用 头盔 显示 
$8. 12 个 无 残疾 、 惯 用 右手 的 男性 受 试 者 随机 指派 

到 三 个 VR 系统 , 每 组 4 名 . 每 个 受 试 者 要 求 用 VR 

系统 执行 “ 拣 起 - 放置 程序. 工程 师 感 兴趣 的 变量 

是 碰撞 频率 , 用 移动 物体 之 间 的 碰撞 次 数 度量 . 研 

究 的 一 个 课题 是 比较 这 三 种 VR 手 复原 系统 受 试 者 

的 平均 碰撞 频率 . 

a 指出 这 项 研究 的 试验 单位 . 

. 指出 处 理 . 

. 指出 因 变 量 . 

. 说 明 为 什么 用 完全 随机 化 设计 来 收集 数据 . 

. 提出 一 个 允许 比较 均值 的 回归 模型 . 

给 出 ANOVA 严 检 验 的 原 假设 和 备 择 假设 . 

. ANOVA 的 下 检验 发 现 a =0.05 时 是 不 显著 的 . 
给 出 这 个 结果 的 实际 解释 . 

14.9 估计 冰 渍 物 的 年 龄 . 参考 练习 2. 20American 

Journal of Science(2005 年 1 月 ) 关 于 在 威 斯 康 里 沉 

积 的 冰 汗 物化 学 组 成 的 研究 . 沉积 物 中 铝 和 皱 的 比 

率 与 沉积 的 持续 时 间 有 关 . 回忆 确定 的 26 个 沉积 

冰 清 物 样品 的 样本 中 铝 / 镍 的 比率 并 保存 在 TILL- 

RATIO 文件 中 . 冰 渍 物 样品 是 从 5 个 不 同 的 钻井 

中 得 到 的 (分 别 记 为 UMRB-1、UMRB-2 、UMRB-3 、 

SWRA 和 SD). 数据 在 下 表 中 给 出 . 进行 数据 的 方 

差分 析 , 取 a = 0. 03. 有 充分 的 理由 表明 5 个 钻井 


mm mno p. 0 c 


"PESE EIE E EGRE EA IR] B] R3 ? 

UMRB-1: 3.75 4.05 3.81 3.23 3.13 3.30 3.21 
UMRB2; 3.32 4.09 3.90 5.06 3.85 3.88 
UMRB3; 4.06 4.56 3.60 3.27 4.09 3.38 3.37 


^ SWRA: 2.73 2.95 2.25 


SD: 2.73 2.55 3.06 


资料 来 源 : American. Journal of Science, Vol. 305 , No. 1 , Jan. 
2005 , p. 16( Table 2). 


14.10 危险 的 有 机 溶剂 . Journal of Hazardous Materi- 


als(1995 年 7 月) 发 表 了 关于 用 于 清洁 金属 部 件 的 
三 种 不 同类 型 危险 的 有 机 溶剂 的 化 学 性 质 : 芬芳 
38. AMEK. 研究 的 一 个 变量 是 吸附 比 , HE 
尔 分 数 度量 . 测试 每 种 类 型 溶剂 的 独立 样本 , 并 记 
录 下 它们 的 吸附 率 , 如 下 表 所 示 . 











资料 来 源 : Journal of Hazardous Materials, Vol. 42, No.2, 
J. D. Ortego et al. , ^A review of polymeric geosynthetics used 
in hazardous waste facilities”, p. 142 ( 3€ 9) 1995 4E 7 H, 
Elsevier Science-NL. , Sara Burgerhartstraat 25 , 1055KV. Am- 
sterdam. The Netherlands. 


a， 建 立 数据 的 ANOVA K. 
b. 有 充分 的 理由 表明 三 种 有 机 溶剂 的 平均 吸附 率 
是 不 同 的 吗 ? 用 a =0.01 检验 . 


14.11 黄 著 胺 对 记忆 的 影响 . 250 BEL MERE 


病人 入 睡 的 镇 静 剂 . 在 Behavioral Neuroscience ( 2004 
年 2 月 )， 医 学 研究 人 员 测 试 了 黄 蘑 胺 对 词 对 关联 
记忆 的 影响 ， 从 大 学 社团 征召 总 共 28 个 受 试 者 ， 
给 他 们 一 张 记 忆 有 联系 的 词 对 表 , 对 列表 中 的 每 一 
个 词 对 (如 强盗 - 监狱 ) 都 有 一 个 第 一 个 词 一 样 而 
第 二 个 词 不 同 的 关联 词 对 ( 如 强盗 -警察 ). 将 受 试 
者 随机 地 分 为 三 个 处 理 组 , 第 1 组 受 试 者 注射 万 营 
胺 , 第 2 组 受 试 者 注射 格 隆 铵 (一 种 活性 安慰 剂 ) , 
第 3 组 受 试 者 不 给 任何 药物 . 4 个 小 时 以 后 , 给 受 
试 者 看 列表 中 12 个 词 对 , 并 测试 他 们 可 以 回忆 多 
少 个 关联 词 对 , 记 住 的 (基于 研究 者 文章 中 提供 的 
摘要 信息 ) 模 拟 词 对 数 在 下 表 中 给 出 . 在 分 析 之 前 
研究 人 员 的 理论 认为 , 注射 碎 营 胺 的 受 试 者 (第 1 
组 ) 回 忆 的 平均 词 对 数 少 于 另外 两 组 相应 的 平均 . 
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a. 说 明 为 什么 这 是 一 个 完全 随机 化 设计 . 

b. 指出 处 理 和 响应 变量 . 

c. 求 三 个 组 的 样本 均值 ， 有 充分 的 信息 支持 研究 
者 的 理论 吗 ? 加 以 解释 . 

d. 进行 数据 的 ANOVA 的 下 检验 , 有 充分 的 理由 表 
明 (a =0.05) 三 个 处 理 组 之 间 回 忆 的 词 对 平均 
数 是 不 同 的 吗 ? 


一 一 一 一 一 L 
组 1 


CORSO: 5 8 8 6 6 6 6 8 6 4 5 6 
组 2 

CRF): 8 10 12 10 9 7 9 10 
组 3 

(X25): 8 9 11 12 11 10 12 12 

14.12. 声 纳 系统 使 用 的 缩写 . 进行 一 项 试验 确定 在 
康涅狄格 州 的 格 罗 顿 海军 潜艇 医学 研究 实验 室 使 
用 的 声 纳 控制 台 上 缩写 任意 特定 单词 组 合 的 最 优 
方法 (Human Factors, 1984 年 2 月 ). 20 名 海军 和 文 
职 人 员 参 加 了 这 项 研究 , 其 中 5 名 非常 熟悉 声 纳 系 
统 . 15 个 受 试 者 对 系统 不 熟悉 ， 他 们 被 随机 地 分 为 
328, 每 组 5 A. 因此 研究 总 共有 4 个 组 (1 组 有 经 
验 的 和 3 组 无 经 验 的 ) , 每 组 5 个 受 试 者 . 指派 经 验 
组 和 一 个 非 经 验 组 (分 别 记 为 全 和 TI) 学 习 简 单 的 
缩写 方法 . 指派 剩 下 的 一 组 无 经 验 组 学 习 传 统 的 单 
一 缩写 方法 ( 记 为 CS) ， 而 另 一 组 被 指派 学 习 传统 
的 复式 缩写 法 ( 记 为 CM). 然后 给 每 个 受 试 者 一 张 
有 75 个 缩写 词 的 列表 学 习 ， 一 次 一 个 人 , 通过 微 
型 计算 机 显示 控制 台 学 习 ， 记录 直到 受 试 者 精确 地 
至 少 译 出 列表 中 词 的 90% 时 的 试验 次 数 ， 这 些 数 据 
提供 了 充分 的 理由 表明 4 组 所 需 的 试验 平均 次 数 
是 不 同 的 吗 ? 用 a =0.05 检验 . 





CM CS TE TI 
4 6 5 8 
7 9 5 4 
5 5 7 8 
6 7 8 10 


oo 
© 
~N 
w 


资料 来 源 : Data are simulated values based on the group means 
reported in Human Factors , Feb. 1984. Copyright 1984 by the 
Human Factors Society. Inc and reproduced by permission. 


14.13 混凝土 的 “ 潜 伸 ”. 与 大 多 数 其 他 常见 工程 原 


料 不 同 , 混凝土 在 第 一 次 负荷 下 加 热 后 经 历 一 个 
“ 潜 伸 " 式 显著 增 长 的 特性 . 为 调查 这 种 现象 , 进行 


关于 混凝土 热膨胀 行为 的 研究 ( Magazine of Concrete 
Research, 1985 年 12 H), 制备 混凝土 样品 , 并 对 每 
一 个 施加 固定 负载 . 将 样品 随机 地 指派 为 5 个 温度 
设置 (100% 、200% 、300% . 400 和 500% ) 中 的 
一 个 , 然后 给 试验 样品 以 每 分 钟 1°C 的 速度 加 热 到 
指定 的 温度 . 对 每 个 样品 , 计算 自由 的 (无 负载 的 ) 
热 应 变 和 负载 导致 的 热 应 变 间 的 差异 , 称 为 总 的 热 
应 变 . 每 个 温度 设置 的 总 的 热 应 变 值 的 样本 容量 、 
均值 、 标 准 差 在 下 表 中 给 出 .( 注 : 记录 的 热 应 变 单 
位 x105. ) 





温度 样品 个 数 ”均值 标准 差 
100 16 52 55 
200 16 112 108 
300 16 143 127 
400 16 186 136 
500 14 257 178 


资料 来 源 :Khoury, G. A. , Grainger, B. N. , and Sullivan. 
P. J. E. "Strain of concrete during first heating to 600*C under 
load". Magazine of Concrete Research, Vol. 37 , No. 133 , Dec. 
1985,p. 198(3€ 2). 


a 对 每 个 温度 求 和 ,对 所 有 78 个 应 变 测 量 值 求 
和 . 然后 计算 CM 和 SST. 

b. 因为 不 知道 7 1 的 值 ， 所 以 用 合并 方法 计 
算 SSE; 


hi n2 
SSE - Y (y. -7) + Xon -») 
izi izi 


tt 2, 0s -») 
-(n,-1)s] *t(m-1)s4-- + (ns -1)5 
c. 求 SS( 总 ). 
d. 建立 数据 的 方差 分 析 表 . 


e. 有 充分 的 理由 表明 加 热 温度 影响 混凝土 的 平均 
总 热 应 变 吗 ? 用 w 20.01 检验 . 


14.14 油轮 外 过 破损， 人 参考 练习 2.71， Marine Tech- 


nology( 1995 年 1 月 ) 人 研究 由 于 油轮 导致 的 较 大 石油 
ie, 48 稻 油 轮 泄漏 量 ( 千 米 吨 ) 和 引起 意外 的 原 
因 保 存在 OLLSPILL 文件 中 ( 注 ; 删除 了 两 艘 不 明 
原因 泄漏 的 油轮 ) . 进行 方差 分 析 (a = 0. 01) 比较 4 
种 事故 类 型 导致 的 平均 石油 泄漏 量 : (1) 碰撞 ; 
(2) 搁 浅 ; (3) 火灾 /爆炸 ; (CA Poe atii. 并 解释 
结果 . 
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14.4 随机 化 区 组 设计 


随机 化 区 组 设计 是 常用 的 减少 干扰 设计 , 回忆 (定义 13.9) 随 机 化 区 组 设计 使 用 同 质 的 试验 单位 组 ( 尽 
可 能 地 紧密 匹配 ) 比较 与 p 个 处 理 关联 的 总 体 均 值 , 随机 化 区 组 设计 的 一 般 安 排 在 图 14.8 中 给 出 . 注意 有 8 


个 相对 同 质 的 试验 单位 的 区 组 , 因为 每 个 区 组 中 都 必须 区 组 
出 现 每 个 处 理 , 所 以 每 个 区 组 包含 p 个 试验 单位 . 尽管 :1 2 3 UO b 


图 14.8 显示 的 p 个 处 理 在 区 组 中 是 依次 的 , 但 实际 
+, 它们 以 随机 次 序 指派 到 试验 单位 (因此 称 为 随机 
化 区 组 设计 ). 

随机 化 区 组 设计 的 完全 模型 包含 (p - 1) 个 处 理 
的 虚拟 变量 和 (4 -1) 个 区 组 的 虚拟 变量 . 因此 除了 
Bo 外 ,模型 中 总 的 项 数 为 (p -1) + (58-1) =p+b- 
2, 如 下 所 示 : 

完全 模型 : 
E(y) =Bo + Bii +B2%2 + +Bp-1%p-1 

处 理 效 应 
+ Bpxp t +Bp+b-2%p+b-2 


区 组 效应 




















图 14.8 随机 化 区 组 设计 的 一 般 形式 (7T, 表示 处 理 ) 
其 中 : 
_ [1 如 果 是 处 理 2 1 如 果 是 处 理 3 1 如果 是 处 理 P 
uu lo 如 果 不 是 7C lo 如 果 不 是 00 0007 lo 如 果 不 是 
_ [1 如 果 是 区 组 2 1 如 果 是 区 组 3 1 如 果 是 区 组 8 
Ln lo 如 果 不 是 au lo 如 果 不 是 C psbo2 lo 如 果 不 是 
注意 模型 不 包含 处 理 - 区 组 的 交互 作用 项 . 原因 有 两 个 方面 , 首先 , 这 些 项 相 加 后 将 剩 下 0 个 自由 度 
fli o? ; 其 次 由 定义 , 处 理 对 间 的 均值 差 减少 在 各 区 组 保持 相同 , 就 是 试验 误差 . 换 句 话说 , 在 随机 
化 区 组 设计 中 , 处 理 - 区 组 交互 作用 与 试验 误差 是 同义词 . 
分 析 的 主要 目的 是 比较 p 个 处 理 均值 jw , Ha UU, 1w,， 即 要 检验 原 假设 
Ho:p1 =M =Ma =… = 
回忆 (13.3 节 ) 这 等 价 于 检验 完全 模型 中 的 所 有 处 理 参数 是 否 都 等 于 0, 即 
Hy: Bi =B 77 7 B, 20 
用 回归 完成 这 个 检验 , 舍弃 处 理 项 并 拟 合 简化 模型 ， 
检验 处 理 的 简化 模型 : 


E(y) =P + B,x, +Bp+1%p+1 Tn *By «à -2*p «5-2 
区 组 效应 
然后 ,我 们 用 "部 分 ”正统 计量 比较 两 个 模型 的 SSE 、SSER 和 SSEc : 
yo (SSR ~ SSEc )/ 检 验 的 B 个 数 (SSER -SSEc)/(p — 1) 
MSEc H MSE, 
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显著 的 正 值 意味 着 处 理 均值 不 同 . 

试验 者 偶尔 也 想 确定 分 区 在 消除 外 部 变异 来 源 方面 是 否 有 效 ， 即 是 否 存 在 区 组 均值 之 间 有 差异 
的 证 据 . 事实 上 , 如 果 区 组 均值 间 没 有 差异 , 试验 人 员 由 于 分 区 将 丢失 信息 ,因为 分 区 减少 了 估计 模 
型 方差 S? 的 自由 度 . 如 果 分 区 对 减少 变异 性 没有 效果 ， 那么 完全 模型 中 的 区 组 参数 将 等 于 0( 即 区 组 
均值 间 没 有 差异 ). 因此 , 我 们 要 检验 

Hy B, =B = =Bp 10-2 =0 

男 一 个 简化 模型 是 舍弃 区 组 B86, Hd. 

检验 区 组 的 简化 模型 ; 


E(y) =Bo + Bixi +B2x2 + i * B, _1xp -1 
处 理 效应 


比较 第 二 个 简化 模型 的 SSE 和 通常 形式 完全 模型 的 SSE, TEN F 检验 意味 着 分 区 组 对 消除 (或 减 
少 ) 作 为 目标 的 外 部 变异 来 源 是 有 效 的 . 














这 两 个 检验 总 结 在 下 面 框 格 中 . 
p 个 处 理 b 个 区 组 的 随机 化 区 组 设计 模型 和 ANOVA F 检验 
完全 模型 ; 
(p -1) 个 处 理 效应 (5 -1) 个 处 理 效应 
E(y) = tux te *B, xa +B,x, to +B, 2X +.2 
其 中 : 
«(i 如 果 是 处 理 2 -fi Ju RAE Ab 3E p 
' (0 ”如果 不 是 "U lo 如果 不 是 
_ [1 如果 是 区 组 2 _ [1 AmXEXKAD 
“= 如 果 不 是 — ZEN 如 果 不 是 
比较 处 理 均值 的 检验 


H: B, =b, =…=B =0 (B 为 :p 个 处 理 均 值 都 相等 ) 
H,:#|# H, 中 的 参数 至 少 有 一 个 不 等 于 0 CRI H, 至 少 两 个 处 理 的 均值 不 等 ) 
简化 模型 :E(y) =o +B,x, + 十 加 23,82 





L ll m (SSE, -SSEc)/(p-1) (SSE, - SSE.)/(p - 1) 
个 验 乡 ue = = 
检验 统计 量 : F SSE,/(n-p-b41) MSE, 














à T: 
. SSE, = 简化 模型 的 SSE 

SSE, = 完全 模型 的 SSE 

MSE, = 完全 模型 的 MSE" 
拒绝 域 : F> F,, HP FINE BE vL =p 一 1 fuv, = (n-p-b+1). 
比较 区 组 均值 的 检验 
HB, = Bra =0 (E Hib E 83946 383828) 
H,: JÆ H, 中 的 B 参 数 至 少 有 一 个 不 等 于 0 CHH, 至 少 两 个 区 组 均值 不 等 ) 
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简化 模型 :E(y) 2 By Box, Box, 十 十 p -1Xp -1 
lim (SSE, -SSE,)/(b-1) (SSE, -SSE.)/(b -1) 
检验 统计 量 : F= SSE/(n-p-b+1) 一 MSE, 
拒绝 域 : F»F., Hop F M E EN v, =b-1 fv, =(n-p-b+1). 
假定 : 1. KAFEE tAE 2 E| 08 22 BUS 2 EEM E d. 
2. 所 有 一 对 观测 值 差 的 方差 是 常数 且 都 相同 . 




















| 例 14.5 在 递交 一 份 建筑 任务 投标 之 前 , 成 本 工程 师 准 备 一 份 为 完成 任务 所 需 的 估计 劳动 力 和 原 
料 花费 的 详细 分 析 , 这 个 估计 依赖 于 执行 分 析 的 工程 师 . 过 大 的 估计 将 减少 接受 公司 投标 价格 的 机 
会 , 而 过 低 的 估计 会 减少 利润 甚至 使 公司 在 这 个 任务 上 赔钱 . 一 个 雇用 了 3 位 任务 成 本 工程 师 的 公 
司 想 要 比较 工程 师 估计 值 的 平均 水 平 . 每 位 工程 师 对 相同 的 4 个 任务 做 出 估计 , 数据 (单位 : 10 TÆ 
元 ) 在 表 14.4 中 给 

表 14.4 例 14.5 的 随机 化 区 组 设计 的 数据 











任务 
1 3 3 7 处 理 均值 
1 4.6 6.2 5.0 6.6 5.60 
工程 师 2 4.9 6.3 5.4 6.8 5.85 
3 4.4 5.9 5.4 6.3 5.50 
EX ép 4.63 6. 13 5.27 6.57 
a. 对 数据 进行 方差 分 析 ， 并 检验 以 确定 是 否 有 充分 的 证 据 表明 处 理 均值 之 间 有 差异 , 用 - 0. 


05 检验 . 
b. 检验 以 确定 任务 分 组 对 减少 估计 值 的 任务 与 任务 间 的 变异 性 是 否 成 功 , 用 a =0.05 检验 . 
解 
a. 因为 我 们 希望 相同 任务 的 估计 值 比 不 同 任务 之 间 的 估计 值 更 相近 ， 所 以 依照 随机 化 区 组 设计 

收集 这 个 试验 的 数据 . 因此, 试验 包含 3 个 处 理 (工程 师 ) 和 4 个 区 组 (任务 )， 
这 个 设计 的 完全 模型 是 ; 

E(y) =pBo + Bizi +B2x + Bszs * Bax, + Bs xs 
处 理 ( 工 程 师 ) 区 组 (任务 ) 


其 中 
yY= 成 本 估计 值 
_ /1 如 果 是 工程 师 2 f 如 果 是 工程 师 3 
“= 如 果 不 是 == Í 


0 MERE 
基准 水 平 = 工程 师 1 E 
1 如 果 是 区 组 2 1 如 果 是 区 组 3 1 如 果 是 区 组 4 
lo 如 果 不 是 io 如 果 不 是 s * [o 如 果 不 是 

基准 水 平 = 区 组 1 
完全 模型 的 SAS 输出 在 图 14.9 中 给 出 . 注意 SSE。 =0.18667 和 MSE, =0.0311( 输 出 的 阴影 部 分 ). 
为 检验 处 理 均值 之 间 的 不 同 , 我 们 检验 
Ho: =m =Ma 


X3 = 
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Dependent Variable: COST 
finalysis of Variance 

Sum of Mean 
Source DF Squares Square F Value Pr >F 
Model 5 7.02333 1.40467 45.15 0.0001 
Error 6 0.18667 0.03111 
Corrected Total 11 7.21000 

meme... SEP 7-7 H 7:21000 MCN 





Ront MQF ^ sanna 一 一 
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检验 的 其 余 组 成 部 分 如 下 : 
检验 统计 量 : 
F- 《SSER -SSEc)/(p-1) (0.44667 - 0. 18667)/2 -4.18 
MSEc 0.03111 
拒绝 域 :已 >5.14, 其 中 Foos =5.14( HÆ B. 10 得 到 ) 基 于 vi = (p-1) =2 个 自由 度 , v, = (n —p — 


b+1) =6 个 自由 度 . 
结论 : DNO F 24.18 小 于 临界 值 5.14, 在 显著 性 水 平 a =0.05 BF, 没有 充分 的 证 据 表明 3 位 成 本 工 
程 师 的 平均 估计 间 有 差异 . 
作为 一 种 选择 ,SAS 将 进行 峙 套 模型 的 下 检验 . 检验 统计 量 正 =4.18 在 图 14. 9 完全 模型 的 SAS 
输出 中 部 着 重 显示 , 检验 的 p 值 (也 着 重 显示 ) 是 p 值 20.0730. 因为 这 个 值 超过 了 a =0.05, 所 以 证 
实 了 结论 :没有 充分 的 理由 拒绝 Ho. 
b. 检验 对 任务 分 区 的 有 效 性 , 在 a 指定 的 完全 模型 中 , 我 们 检验 
Hy: B4 7 B4 =Bs =0 
简化 模型 为 : 
E(y) =Bo + Bix1 * Bax, 
"AE CER) 
第 2 个 简化 模型 的 SAS 输出 在 图 14. 11 中 给 出 . HERE SSER =6.95( 输 出 的 阴影 部 分 ). 检验 的 组 成 部 分 如 下 : 
检验 统计 量 : 
F- (SSER -SSEc)/(b-1) _ (6. 95 - 0. 18667) /3 
MSE, 0.03111 
拒绝 域 : F 54.76, 其 中 Fo as -4.76 (HER B. 10 得 到 ) 基 于 vi = (p-1) =3 B BUE, v =(n-p-b+ 
1) =6 + H IHRE. 
结论 :因为 =72.46 超过 临界 值 4.76, 在 显著 性 水 平 a =0.05 时 , 有 充分 的 证 据 表明 区 组 (任务 ) 平 
均值 之 间 有 差异 . 看 来 在 成 本 估计 中 , 任务 分 组 对 减少 任务 与 任务 间 的 变异 性 是 有 效 的 . 


Dependent Var iable: COST 





=72. 46 





ñnalysis of Var iance 


Sum of Mean 

Source DF Squares Square F Value Pr >F 
Model 2 0.26000 0.13000 0.17 0.8477 
Error 9 5.95000 0.77222 
Corrected Total 11 7.21000 

Root MSE 0.87876 R-Square 0.0361 

Dependent Mean 5.65000 fidj R-Sq -0.1781 

Coeff Var 15.55331 


Paraneter Estimates 





Parameter Standard 
Variable DF Estimate Error t Value Pr > iti 
Intercept 1 5.60000 0.43938 12.75 €«.0001 
xi 1 0.25000 0.62138 0.40 0.6968 
x2 1 -0.10000 0.62138 -0.16 0.8757 








图 14. 11 检验 区 组 的 随机 化 区 组 设计 简化 模型 的 SAS 回归 输出 
我 们 还 要 求 SAS 执行 区 组 的 媒 套 模型 下 检验 . 结果 下 =72.46, p 值 <0.0001, 在 图 14.9 的 SAS SE 
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全 模型 输出 的 底部 阴影 部 分 给 出 . 小 的 p 值 确认 我 们 的 结论 : 有 充分 的 证 据 (在 a = 0.05) E Ho. 

注意 ; 区 组 均值 相等 性 检验 结果 必须 小 心地 解释 , 特别 当 玉 检 验 统计 量 的 计算 值 没有 落 在 拒绝 域 时 ， 
这 不 一 定 意味 着 区 组 均值 相等 ， 即 分 区 组 是 不 重要 的 . 得 到 这 个 结论 等 价 于 接受 原 假设 , 我 们 必须 小 心地 
避免 习惯 ,因为 不 知道 [型 错误 ( 当 甩 ,为 真 时 , 接受 Ho) VICE. 换 身 话说 ， 即使 对 区 组 不 同 的 检验 没有 结 
论 , 仍 可 以 在 类 似 的 未 来 试验 中 利用 随机 化 区 组 设计 . 如 果 试 验 者 相信 区 组 内 比 区 组 间 更 同 质 , 将 会 用 随 
机 化 区 组 设计 ,而 不 管 试验 单位 在 比较 区 组 均值 的 检验 是 否 说 明 它们 是 不 同 的 . 

用 于 分 析 由 随机 化 区 组 设计 收集 的 数据 的 传统 方 
差分 析 与 完全 随机 化 设计 类 似 . 随机 化 区 组 设计 的 
SS( 总 ) 的 分 解 由 图 14.12 很 容易 看 出 , 这 里 SS( 总 ) 已 

图 14.12 随机 化 区 组 设计 的 总 平方 和 的 分 解 











总 平方 和 SS( 总 ) 





被 分 解 为 三 部 分 : 
SS( 总 ) = SSB + SST + SSE. 


计算 SSB 和 SST 的 公式 与 完全 随机 化 设计 中 计算 SST 


的 公式 有 相同 的 形式 . 
由 这 些 量 , 得 到 处 理 均 方 MST, 区 组 均 方 MSB 以 及 误差 均 方 MSE, 如 后 面 给 出 . 检验 统计 量 是 : 
MST 
= MSE’ 检验 处 理 
MSB 
= MSE’ 检验 区 组 


这 些 正 值 等 价 于 回归 方法 的 “部 分 "到 统计 量 . 





随机 化 区 组 设计 的 ANOVA 计算 公式 
Dr = 所 有 nn 个 测量 值 的 和 . 


n 


Y y = 所 有 nn 个 测量 值 的 平方 和 ， 


(所 有 测量 人 的 总 和 )” CiU 
测量 值 的 总 个 数 n 


SS( 总 ) = 总 平方 和 =( 所 有 测量 值 平方 和 ) Q CM = Y y; - CM. 
SST = 处 理 平方 和 =( 每 个 处 理 内 测量 值 之 和 的 平方 除 以 那个 处 理 测量 值 的 个 数 b 之 总 和 ) -CM 





CM = 均值 的 修正 = 








T E T, 
TU. tb t t CM. 
SSB = 区 组 平方 和 = (每 个 区 组 内 测量 值 之 和 的 平方 除 以 那个 区 组 的 测量 值 个 数 己 的 总 和 ) -CM 
BOB B, 
=—+— + +— - CM. 
p P P 
SSE = 误差 平方 和 =SS( 总 ) -SST - SSB. 


MST = 处理 均 方 75-1 


MSB = 区 组 均 方 = 
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SSE 

MSE = 误差 均 方 gore 
MST 

F-WSE' 检验 处 理 . 


MSB 
= — 2 4 
F-MSE' 检验 区 组 











参考 例 14.5, 用 ANOVA 方法 对 表 14.4 中 的 数据 进行 方差 分 析 . 

解 不 用 手 算 ( 仍 将 此 作为 学 生 的 练习 ) , 而 用 统计 软件 包 计算 . SPSS 的 ANOVA 输出 在 图 14.13 
中 给 出 , 检验 处 理 的 下 值 , F 24.179, 检验 区 组 的 正 值 , F =72.464 , 都 是 输出 中 的 阴影 部 分 . 注意 这 
些 值 与 例 14.5 中 回归 方法 计算 的 己 值 是 一 样 的 . 检验 的 p 值 (也 是 阴影 的 部 分 ) 得 到 同样 的 结论 , Di 
如 , 检验 处 理 差 异 的 p 值 , p -0.073, 大 于 a =0.05; 因此 ,处理 均值 闻 有 差异 的 证 据 是 不 充分 的 


Tests of Between-Subjects Effects 


Dependent variable: COST 










































Type Ill Sum 
Source of Squares df Mean Square F Sig 
Corrected Model 7.0233 5 1.405 45.150 
Intercept 383.070 1 383.070 |12312.964 
ENGINEER 250 2 130 4179 .073 
5.763 3 2.254 72.464 .000 
187 6 | 3.111E-02 

390.280 12 

Corrected Total 7.210 11 














a. R Squared = .974 (Adjusted R Squared = .953) 
图 14.13 随机 化 区 组 设计 的 SPSS ANOVA 输出 


如 同 用 完全 随机 化 设计 一 样 , 将 随机 化 区 组 设计 的 变异 来 源 和 各 自 的 自由 度 , 平方 和 以 及 均 方 
汇总 在 方差 分 析 表 内 ,随机 化 区 组 设计 ANOVA 表 的 形式 如 下 面 所 示 ; 表 14.4 中 数据 的 ANOVA d 
TER 14.5 给 出 (这 些 量 都 由 图 14.13 输出 中 得 到 的 ). 注意 这 三 个 变异 来 源 ( 处理、 区 组 和 误差 ) 的 
自由 度 相 加 就 是 SS( 总 ) 的 自由 度 , 类 似 地 ， 三 个 来 源 的 平方 和 相 加 就 是 SS( 总 ). 

ZZ 2 S db aceti e Men 











随机 化 区 组 设计 ANOVA 表 的 一 般 形式 
来 源 df SS MS F 
处 理 p-1 SST MST MST/MSE 
区 组 b-1 SSB MSB MSB/MSE 
误差 n-p-b+1 SSE MSE 
总 和 n-1 SS( 总 ) 
一 








注意 当 对 试验 中 的 处 理 进行 分 组 时 ， 有 一 点 是 非常 重要 的 . 回忆 13.3 节 中 消去 区 组 效应 ,这 个 
事实 使 我 们 能 够 计算 处 理 均值 之 差 的 置信 区 间 . 但 如 果 样 本 的 处 理 均值 用 于 估计 单个 处 理 均值 ， 区 
组 效应 没有 消除 ， 因此， 得 到 区 组 设计 中 单个 处 理 均值 (以 及 相应 的 置信 区 间 ) 的 无 偏 估 计 的 唯一 方 
流 是 从 一 个 大 的 区 组 集合 (总体 ) 中 随机 选取 区 组 ， 并 将 区 组 效应 作为 除 随机 误差 之 外 的 第 二 个 随机 
231. 包含 两 个 或 更 多 随机 分 量 的 设计 称 为 嵌 套 设计 ， 已 超出 了 本 书 的 范围 , 关于 这 个 主题 的 更 多 
内 容 , 查询 本 章 的 参考 文献 . 











试验 设计 的 方差 分 析 557 
314.5 Bj 14.6 的 ANOVA 分 析 总 结 表 
来 源 df SS MS F 
处 理 (工程 师 ) 2 0. 260 0. 130 4.18 
区 组 (任务 ) 3 6.763 2. 254 72. 46 
误差 6 0.187 ` 0.031 
总 和 11 7.210 
应 用 练习 月 /年 Jn 犹他 州 阿拉 斯 加 
14.15 旋 内 研究 . Physical Therapy (1986 年 8 月 ) 发 " — M » » 
表 了 一 篇 研究 “确定 在 执行 届 曲 侧 旋 本 体感 觉 神经 11/2001 36 i5 » 


肌肉 助 张 模式 时 是 否 发 生 与 肩 同时 弯曲 的 旋 内 

(DF) ”的 研究 . 10 个 肩膀 没有 疾病 症状 或 运动 限 

制 的 学 生 , 作为 这 项 研究 的 受 试 者 . 对 每 个 受 试 

者 , 测量 在 (D,F) 模 式 三 个 位 置 的 旋 内 ( 度 ): (1) 

开始 位 置 ;(2) 改变 旋转 方向 的 点 ;(3) 结束 位 置 . 

分 析 的 目的 是 比较 三 个 位 置 的 平均 旋 内 测量 值 . 

a. 指出 试验 的 处 理 . 

b. 指出 试验 的 区 组 . 

c. 指出 响应 变量 . 

d. 说 明 为 什么 对 这 个 试验 随机 化 区 组 设计 是 适 
当 的 . 

e. 给 出 适合 分 析 数 据 的 线性 模型 . 

14.16 回旋 式 石油 钻井 机 . 参考 例 13.5, 设计 试验 

比较 3 个 州 ( 加 利 福 尼 亚 、 犹 他 和 阿拉 斯 加 ) 的 月 

平均 运转 回旋 式 石油 钻井 机 台数 . 回想 为 了 消除 数 

据 中 月 与 月 之 间 的 变异 性 , 选择 随机 化 区 组 设计 . 

在 2 年 期 间 随 机 选择 3 个 月 , 由 World Oil (2002 年 

1 月) 杂志 提供 的 数据 得 到 每 个 州 每 月 回旋 式 石 油 

钻井 机 运转 台数 , 数据 在 附 表 中 给 出 . 


a. 建立 数据 的 ANOVA 汇总 表 . 

b. 是 否 有 充分 的 证 据 证 明 3 个 州 每 月 回旋 式 石油 
钻井 机 平均 运转 台数 存在 差别 ? 用 a =0. 01 

c. 进行 检验 以 确定 对 月 分 组 在 消除 数据 中 月 与 月 
的 外 部 变异 性 是 否 有 效 , 用 a =0.01 检验 . 


14.17 修复 管道 裂缝. 佩斯 (澳大利亚 ) 城 市 水 务 局 


最 近 完 成 了 一 项 从 初级 处 理 厂 传输 家 庭 废水 的 陆 
地 管道 建设 . 建筑 期 间 , 检测 管道 水 泥 砂浆 内 衬 的 
RE, 确定 自 愈合 是 否 能 糊 住 裂缝 ,否则 必须 用 昂 
贵 的 环 氧 填充 物 ( Proceedings of the Institute of Civil 
Engineers, 1986 年 4 月 刊 ). 观察 到 管道 中 的 裂缝 
后 , 保持 充满 水 14 周 的 时 间 , 在 浸 湿 期 间 的 第 2 
周 、 第 6 周 和 第 14 周 后 , 测量 12 个 裂缝 位 置 处 烈 
缝 宽 度 (mm), 数据 是 下 页 给 出 的 表 . 用 SAS 对 数 
据 进行 ANOVA 的 输出 在 下 面 给 出 . 进行 检验 确定 
4 个 时 期 的 平均 裂缝 宽度 是 否 不 同 , 用 a = 0. 05 
检验 . 








The ANOVA Procedure 
Dependent Variable: WIDTH 
Sum of 

Source DE Squares Hean Square F Value Pr > F 
Model 14 2.96188333 0.21156310 13.71 €«.0001 
Error 33 0.50930833 0.01543353 
Corrected Total 47 3.47113167 

B-Square Coeff Var Boot MSE MIDTH Mean 

0.853276 46.08296 0.124232 0.269583 
Source DF finova 558 Mean Square F Value Pr > E 
PERIOD 3 2.68489167 0. 89496389 57.99 <.0001 
LOCATION 11 0.27699167 9.02518106 1.63 0.1354 








练习 14.17 的 SAS 输出 
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qanm 输 水 后 裂缝 宽度 qanm 输 水 后 裂缝 宽度 

0 Ja 2 fà] 6 JJ 14 Jš] 0 fij 2 Jl 6 周 14 周 

1 0.50 0.20 0.10 0.10 7 0.90 0.25 0. 05 0. 05 

2 0. 40 0. 20 0.10 0. 10 8 1. 00 0.30 0. 05 0.10 

3 0.60 0. 30 0. 15 0. 10 9 0. 70 0. 25 0. 10 0. 10 

4 0. 80 0. 40 0.10 0.10 10 0. 60 0. 25 0. 10 0. 05 

5 0. 80 0.30 0. 05 0. 05 11 0. 30 0.15 0. 10 0.05 

6 1. 00 0.40 0. 05 0. 05 12 0.30 0. 14 0. 05 0.05 





tute of Civil Engineers, Partl , Vol. 80, Apr. 1986 ,p. A79 ( 3& 1). 


14.18 低频 声音 的 暴露 . 次 声 描述 低 于 人 耳 可 听 范 
围 的 声音 频率 . Jornal of Low F. regency, Vibration and 
Active Control( 2004 年 3 月 ) 发 表 了 一 篇 关于 次 声 对 
生理 的 影响 , 练习 7. 49. 在 试验 中 , 5 名 大 学 生 为 
一 组 (A 组 ) 暴 露 在 4 Hz 120 dB 的 次 声 中 1h, 第 二 


组 5 名 学 生 (B 组 ) 暴 露 在 2 Hz 110 dB 的 次 声 中 . 


测量 每 名 学 生 暴露 在 次 声 之 前 和 之 后 的 心率 (次 / 


分 钟 ), 试验 数据 在 表 中 给 出 . 为 确定 次 声 的 影响 ， 


人 研究 人 员 比 较 暴 露 之 前 的 平均 心率 与 暴露 之 后 的 








资料 来 源 ; Cox. B. G and Kelsall. K. J. “Construction of Cape P 





平均 心率 . 

A 组 学 后 RRN RRE B 组 学 生 暴露 前 ”暴露 后 
Al 70 70 Bl 73 79 
A2 69 80 B2 68 60 
A3 76 84 B3 61 69 
A4 77 86 B4 72 77 


A5 64 76 B5 61 66 


一 一 一 -一 -一 
资料 来 源 : Qibai. C. Y. H. „and Shi. H. "An investigation on 
the physiological and psychological effects of infrasound on 


persons. " Journal of Low Frequency Noise, Vibration and Ac- 
tive Control, Vol. 23, No. 1, March 2004 (Tables I -NV). 


a. 对 随机 区 组 设计 用 ANOVA 分 析 A 组 学 生 的 数 


据 , 进行 感 兴趣 的 ANOVA 检验 , 取 w =0.05. 

b. 对 B 组 学 生 重 复 a. 

c. 在 练习 7.49 中 , 用 配对 差 的 T- 检验 分 析 数 据 . 
说 明 结 此 果 等 价 于 随机 化 区 组 ANOVA. (提示 . 
WER F = T°, Kop F E a 中 的 检验 统计 量 , 了 是 
配对 差 的 检验 统计 量 ). 

14.19 建筑 物 的 偏 移 比 研究 . 偏 移 比 是 一 种 估计 受 
到 侧面 负载 的 建筑 物 的 可 靠 性 常用 指标 . 已 经 开发 
了 像 STAAD- 亚 这 样 高 级 计算 机 程序 用 于 估计 基于 





eron Ocean Outlet, Perth, Western Australia. ” Proceedings of the Insti- 


如 横梁 刚度 、 纵 梁 硬 度 、 层 高 、 转 动 惯量 等 变量 的 
偏 移 比 . 纽约 州立 大 学 的 巴 伐 罗 分 校 和 佛罗里达 中 
央 大 学 的 土木 工程 师 进行 一 项 试验 比较 用 STAAD- 
亚 的 估计 和 一 个 新 的 , 更 简单 的 称 为 DRIFT 的 微 
机 程序 的 估计 的 偏 移 比 ( Microcomputer in Civil En- 
gineering , 1993) . 将 21 层 建 筑 物 的 数据 作为 程序 的 
输入 . STAAD- 亚 的 两 个 运行 结果 为 : 结果 1 考虑 建 
筑 物 支柱 的 轴 变 形 , 结果 2 忽略 这 个 信息 . 分 析 的 
目标 是 比较 三 个 计算 机 运行 结果 (两 个 STAAD-HI 
运行 结果 和 DRIFT) 的 平均 偏 移 比 (以 侧 向 位 移 作 
为 偏 移 度量 ). 将 三 个 程序 对 5 个 楼 层 (1,5,10,15， 
21) 估 计 的 侧 向 位 移 (in) 记 录 在 下 表 中 , 这 些 数 据 
的 方差 分 析 的 MINITAB 输出 在 下 页 给 出 . 


楼 层 STAAD- 亚 (1) STAAD-II(2) DRIFT 





1 0.17 0.16 0.16 
5 1.35 1.26 1.27 
10 3.04 2.76 2.77 
15 4.54 3.98 3.99 
21 5.94 4.99 5.00 


资料 来 源 : Valles. R. E. etal. “ Simplified drift evaluation of 
wall-frame structures , " Microcomputers in Civil Engineering , 


Vol.8, 1993, p.242 (%2). 


a. 指出 试验 的 处 理 . 

b. 因为 侧 向 位 移 对 不 同 的 楼 层 变化 很 大 , 用 随机 
化 区 组 设计 减 小 偏 移 的 层 与 层 之 间 的 变异 性 ， 
如 果 所 有 21 层 都 包含 在 此 项 研究 中 用 图 表 解 释 
设计 方案 . 

c. 用 输出 中 的 信息 比较 三 个 程序 估计 的 平均 仿 
移 比 . 
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Analysis of Variance for DRIFT 
Source DF SS MS F P 


PROGRAM 2 0.4664 0.2332 4.79 0.043 
LEVEL 4 52.1812 13.0453 267.74 0.000 
Error 8 0.3898 0.0487 

Total 14 53.0374 





2&2] 14. 18 的 MINITAB 输出 
14.20 评估 无 铝 焊料 , 传统 上 用 于 电子 装配 的 焊料 件 下 的 平均 标准 化 生长 的 测量 值 . 


都 使 用 铝 . 由 于 大 量 的 环境 危险 都 与 含 铅 焊 料 相关 
(例如 地 下 水 污染 和 吸入 细小 的 含 铅 微粒 ) ， 工 程 
师 开 发 了 一 种 无 铝 焊 料 . 在 Soldering Surface Mount 
Technology( Vol. 13,2001) rp, 研究 人 员 比较 传统 的 
锡 铅 合金 焊料 和 三 种 无 铝 合金 : 锡 银 、 锡 钢 和 锡 银 
铜 . 在 6 个 不 同 的 温度 下 测量 每 种 焊料 的 塑性 硬度 
(Nm/m°) , 数据 在 下 表 中 给 出 . 


—— ———————— —————————M—— 
ECC) — We 锡 银 锡 钢 E: 





23 50.1 33.0 14.9 41.0 
50 24.6 27.7 10.5 20.7 
75 23.1 10.7 9.3 17.1 
100 1.8 9.0 8.8 8.7 
125 1.1 4.9 5.4 7.1 
150 0.3 3.2 5.0 4.9 


—— — OUO 
资料 来 源 : Harrison. M. R. , Vincent, J. H. , and Steen, H. 
A.H. “Lead-free reflow soldering for electronics assembly. ” 
Soldering & Surface Mount Technology, Vol. 13, No. 3,2001 
(3 10). 


a. 解释 为 什么 用 随机 化 区 组 设计 的 ANOVA 来 分 
析 数 据 . 
b. 由 分 析 写 出 汇总 的 ANOVA xk. 
c. 4 种 类 型 焊料 的 塑性 硬度 平均 值 是 否 不 同 , 用 
a =0.01 检 验 . 
14.21 基因 的 明暗 变化 . 参考 练习 8.41, Journal of 
Bacteriology(2002 年 7 月 ) 发 表 了 一 篇 关于 细菌 基 
因 对 光 的 灵敏 性 的 研究 . 科学 家 分 离 出 103 种 负责 
光合 作用 和 呼吸 作用 的 细菌 基因 ,每 种 基因 在 “全 
明 ” 的 培养 器 中 长 到 中 指数 期 , 然后 分 别 暴露 在 三 
种 明 / 上 暗 条 件 下 :“ 全 上 暗 " (BAT 24 h). “2839326 
( 开 灯 持续 90 min)、“ 短 暂 黑 上 暗 " ( 关 灯 持续 
90 min). 在 每 个 明 / 上 暗 条 件 结束 时 , 确定 103 种 基 
因 中 每 种 基因 的 标准 化 成 长 的 测量 值 , 全 部 数据 集 
保存 在 GENEDARK 文件 中 (前 10 个 基因 数据 在 
附 表 中 给 出 ). 假定 试验 的 目的 是 比较 三 种 明 / 瞳 条 


a 写 出 一 个 适合 分 析 数 据 的 线性 模型. 





(给 出 前 10 个 观测 值 ) 
基因 编码 E) 短暂 光亮 短暂 黑暗 
SLR2067 — -0.00562 1.40089 ^ -1.28569 
SLR1986 — -0.68372 1.83007 — -0.68723 
SSR3383 -0.25468 -0.79794 -0.39719 
SLLO928 -0.18712 -1.20901 -1.18618 
SLR0335 -0.20620 1.71404 -0.73029 
SLR1459 -0.53477 2.14156 -0.33174 
SLL1326 -0.06291 1. 03623 0. 30392 
SLRI329 -0.85178 -0.21490 0. 44545 
SLL1327 0. 63588 1. 42608  —0. 13664 
SLLI325 -0.69866 1.93014 -0.24820 


资料 来 源 : Gill, R.T., etal. “ Genome-wide dynamic tran- 
scriptional profiling of the light to dark transition in Synecho- 
eystis Sp. PCC6803 ,” Journal of Bacteriology, Vol. 184, No. 
13, 2002 年 7 月 . 


b. 用 a 中 模型 的 B 参数 给 出 比较 明 / 瞳 条 件 均值 的 
原 假设 . 

c. 用 统计 软件 包 进 行 a 中 检验 , 解释 当 a =0.05 的 
结果 . 


14.22 服装 的 自动 化 处 理 系统 . 英国 一 家 生产 牛仔 


裤 的 工厂 最 近 引 进 了 一 个 计算 机 化 自动 处 理 系 统 . 
这 种 新 系统 是 用 高 架 输 送 机 将 衣服 传输 到 装配 线 
上 的 操作 员 ， 当 自动 系统 使 操作 员 处 理 时间 达 到 极 
小 时 , 它 会 阻止 操作 员 提 前 工作 以 及 离开 他 们 的 机 
器 休息 . 在 New Technology, Work and Employment 
(2001 4E 7 月 ) 的 一 项 研究 调查 了 这 种 新 的 处 理 系 
统 对 牛仔 裤 工 厂 工人 缺勤 率 的 影响 . 有 一 种 理论 是 
平均 缺勤 率 会 因 一 周 中 的 各 天 而 不 同 , 因为 操作 员 
次 定 纵容 自己 缺勤 一 天 ,以 缓解 工作 压力 . 随机 地 
选择 9 周 ,确定 工作 周 中 的 每 天 (星期 一 至 星期 
五 ) 缺 勤 率 (缺勤 工人 的 百分比 ) 数 据 在 下 表 中 给 
出 . 进行 数据 的 完全 分 析 ， 以 确定 在 工作 周 的 5 < 
中 平均 缺勤 率 是 否 不 同 . 











周 ”星期 一 星期 二 星期 三 ”星期 四 星期 五 (E) 

1 53 06 1.9 1.3 1.6 周 ”星期 一 星期 二 星期 三 是 期 四 ”星期 五 

2 12.9 9.4 2.6 0.4 0.5 7 11.1 4.2 4.1 4.2 4.1 

3 0.8 0.8 5.7 0.4 1.4 8 9.5 7.1 4.5 9.1 12.9 

4 26 00 45 102 4.5 9 48 52 100 69 9.0 
一 LLL 

5 23.5 9.6 11.3 13.6 14.1 资料 来 源 : Boggis, J. J. “The eradication of leisure.” New 

6 9.1 4.5 7.5 2.1 9.3 Technology, Work, and Employment, Volume 16, No. 2,2001 


年 7 月 ( 表 3). 





14.5 双 因 子 析 因 试验 


在 13.4 节 中 , 已 经 学 过 析 因 试 验 是 为 研究 两 个 或 多 个 自 变量 (因子) 对 响应 y 的 均值 影响 而 进 
行 的 增加 容量 设计 . 在 本 节 中 , 我 们 主要 集中 于 双 因子 析 因 试验 的 分 析 . 

例如 , 假定 想 要 把 已 完成 的 项 目 , 璧 如 说 一 种 新 桌面 的 平均 缺陷 数 与 两 个 因子 油漆 喷枪 的 喷嘴 
类 型 和 喷涂 的 时 间 长 度 有 关 . 进一步 假定 , 想 要 研究 在 三 种 喷嘴 类 型 ( 三 水 平 ) (N. , Na, N3) 和 两 个 
喷涂 时 间 长 度 (两 水 平 )(S1 , 5, ) 下 每 张 桌面 的 平均 缺陷 数 . 如 果 选 择 包括 喷嘴 类 型 的 三 种 水 平和 喷 
涂 时 间 长 度 的 两 种 水 平 所 有 组 合 的 作为 试验 处 理 , 即 观测 因子 水 平 组 合 N.S, ,NS, ， N351, NiS,, 
N58; ,和 N352 的 缺陷 数 ， 称 我 们 的 设计 为 完全 3 x2 因子 试验 , 注意 这 个 设计 将 包括 3 x2 =6 个 处 理 . 

回忆 析 因 试验 对 选择 处 理 是 有 用 的 方法 , 因为 它们 允许 进行 有 关 因 子 交 互 作用 的 推断 . 3 x2 析 
因 试 验 的 完全 模型 包含 (3 -1) =2 个 喷嘴 的 主 效应 ，(2 -1) =1 个 喷涂 时 间 的 主 效应 和 (3 -1) (2- 
1) =2 个 喷嘴 -喷涂 时 间 的 交互 作用 项 : 


E(y) =Bo + Bii tBoxa + Bax + Baxix3 + Bsx>za 
CRS MANTEU uno HORRTRIBDE GER 

模型 中 的 自 变量 (因子 ) 既 可 以 是 定量 的 也 可 以 是 定性 的 . 如 果 它 们 是 定量 的 , 主 效应 由 x, x), 
x° 等 项 表示 ; 如 果 是 定性 的 , 主 效应 由 虚拟 变量 表示 . 在 我 们 的 3 x2 析 因 试验 中 , 喷嘴 类 型 是 定性 

的 , 而 喷涂 时 间 是 定量 的 ; 因此 , 模型 中 的 x 变量 定义 如 下 ， 
OD 如果 是 喷嘴 NN — 0 pp 如 果 是 喷嘴 N, 

cl 如 果 不 是 = 如 果 不 是 

x3 = 喷涂 时 间 长 度 (min) 
注意 到 对 3 x2 析 因 模型 包含 3 x2 =6 个 B Zl. 如 果 对 3 x2 =6 个 处 理 中 的 每 一 个 只 观测 一 个 响应 
y RE, 那么 对 完全 模型 , 自由 度 ( 误 差 ) 是 (n - 6) =0. 因此 , 对 一 个 析 因 试验 , 对 每 个 因子 -水 平 
组 合 观测 值 的 个 数 r( 即 析 因 试 验 的 重复 次 数 ) 必须 总 是 2 或 更 多 . 否则 , 没有 自由 度 可 用 于 估计 o. 
为 了 检验 因子 交互 作用 , 我 们 舍弃 交互 作用 项 并 拟 合 简化 模型 ， 


E(y) =Bo+ BiXi tox; + Bax, 
WESS 。 距 涂 时 间 主 效应 
用 比较 两 个 模型 SSE 的 部 分 正统 计量 来 检验 没有 交互 作用 的 原 假设 Hy: B, = Bs =0. 检验 交互 作用 的 


基准 水 平 = 喷嘴 N3 
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一 般 步骤 汇总 在 下 面 的 框 格 中 . 





a 水 平 的 4 因子 和 5 水平 的 B 因子 的 两 因子 析 
因 试 验 中 交互 作用 模型 和 ANOVA F 检验 


完全 模型 ; 
主 效应 4 的 项 主 效应 8 的 项 
——n— "ART 
E(y) =B *Bix, ++ *B.axsa t Bux, +B... ox uaa 
AB 交 互 作用 项 
*tB.a xix, t Bax +B, iS IX. 1-2 
其 中 9 





1 如 果 是 因子 A 的 水 平 2 Op 如 果 是 因子 4 的 水 平 4 
d 如 果 不 是 st 如 果 不 是 
1 如 果 是 因子 BB 的 水 平 2 _ Jl 如 果 是 因子 如 的 水 平 。 
"lo 如 果 不 是 ea 如 果 不 是 
机 :Bi4-1=Baws=…=Bw-1=0 (了 即 因 子 4 和 B 之 间 没 有 交互 作用 ) 
到 :有 中 的 及 参数 至 少 有 一 个 不 等 于 0 ( 即 因 子 4 和 B 之 间 有 交互 作用 ) 
简化 模型 ， 
主 效应 4 的 项 主 效应 8 的 项 
E(y) «f, *Byix +e Baita] +B,x, t +Barb-2%a+5-2 
SSE, - SSE,)/[ (a -1) (b -1 SSE, - SSE.)/[ (a -1) (b -1 
检验 统计 量 ; p = Š A )] _ (SSE, a )(5-1)] 








其 中 : 

SSE, = 简化 模型 的 SSE 

SSE, = 完全 模型 的 SSE 

MSE, = 完全 模型 的 MSE 

r= 重复 数 ( 即 a xb 析 因 试验 中 每 个 单元 的 y 观 测 值 个 数 ) 
拒绝 域 : F^ F,, KP F RT BRE y, 7(a-1)(b - 1) ft v, 2ab(r-1) 
假定 : 1. 任意 因子 一 水 平 组 合 的 观测 值 的 总 体 概率 分 布 是 近似 正 态 的 . 
2. 概率 分 布 的 方差 是 常数 ， 且 对 所 有 因子 一 水 平 组 合 都 相间 . 

Ož, 对 两 个 因子 都 表示 定性 变量 的 试验 ， 自 变量 5， 和 ，…，xosi_z 是 有 定义 的 主 效应 . 车 一 个 因子 是 定量 
的 ,可 以 选择 如 x x, x° 等 的 定量 项 表示 主 效应 . 














用 相似 的 方法 进行 因子 主 效应 检验 . 从 完全 模型 中 删 去 感 兴趣 的 主 效应 项 ,并 拟 合 简化 模型 ， 
用 通常 的 方式 比较 两 个 模型 的 SSE. 

在 计算 析 因 试验 的 方差 分 析 的 数值 例子 之 前 , 需要 理解 因子 交互 作用 和 因子 主 效应 检验 的 实际 
显著 性 . 我 们 在 例 14.7 中 阐述 这 个 概念 . 
DESA 一 个 冲压 橡胶 、 塑 料 和 其 他 材料 垫圈 的 公司 ,希望 比较 两 种 不 同类 型 的 冲压 机 平均 每 小 时 
生产 垫圈 的 数量 . 实际 上 , 制造 商 想 确定 娜 一 台 机 器 比 别 的 机 器 生产 更 多 ， 甚至 更 重要 的 是 确定 哪 一 台 
鲍 器 在 生产 橡胶 垫圈 时 生产 更 多 ,而 哪 一 台 机 器 在 生产 塑料 整 圈 时 生产 更 多 . 为 回答 这 些 问题 ， 制造 商 
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决定 进行 2x3 析 因 试验 , 用 三 种 垫圈 原料 B. B, AB, 征 每 种 用 两 种 类 型 冲压 机 器 A, 和 As. 每 种 机 
器 对 每 种 垫圈 原材料 运行 3 K, 每 次 1 小时, 18 个 1 小 时 按 随机 次 序 指派 给 6 个 机 器 - 原料 组 合 . ( 随 
机 化 的 目的 是 消除 不 可 控 的 环境 因子 可 能 影响 结果 的 可 能 性 . ) 假 定 已 经 计算 且 绘制 了 这 6 个 处 理 均值 
图 . 6 个 均值 的 两 个 假设 图 分 别 在 图 14. 14a 和 图 14. 14b 中 给 出 . 冲压 机 A, 的 三 个 均值 由 实 折线 连接 ， 
冲压 机 42 的 三 个 均值 由 虚 折 线 连 接 , 关于 两 台 冲 压 机 的 生产 率 , 这 些 图 表示 了 什么 ? 











每 小 时 生产 的 平均 垫圈 个 数 











Ei 
L 
Bs 
E: 
kay 
B- NS 机 器 4 
É 
| ~~、 
E `` 一 一 一 一 一 一 ° 
É 机 器 42 
B, B; Bi 
材料 
a) 无 交互 作用 


B, B, B, 
材料 
b) 交互 作用 


图 14.14 6 个 机 器 - 材料 组 合 的 均值 假设 图 


AR E14. 14a 指出 ,不 管 垫圈 是 何 种 材料 ,机 器 A, 每 小 时 生产 较 多 的 垫圈 , 因此 优 于 机 器 A. 
平均 来 看 , 机 器 41 每 小 时 冲压 软木 ( B, ) 的 垫圈 多 于 橡胶 或 塑料 , 但 是 不 考虑 垫圈 的 原料 ， 两 种 机 器 
生产 的 垫圈 的 平均 数 的 差异 保持 近似 地 相同 . 因此 ， 两 种 机 器 生产 的 垫圈 的 平均 数 差异 与 冲压 过 程 


中 所 用 的 森 圈 原料 是 无 关 的 . 


与 图 14.14a 不 同 , 图 14. 14b 显示 当 热 圈 原 料 是 软木 塞 B, 或 塑料 B, Bf, 机 器 A, 的 生产 率 比 机 器 
Ar 高 , 但 是 对 垫圈 原料 为 橡胶 B, 的 平均 值 却 相反 . 对 这 种 原料 , 机 器 A, 比 机 器 41 平均 每 小 时 生产 更 
多 的 垫圈 . 因此 , 图 14. 14b 阐述 这 样 一 个 情况 ， 由 两 种 机 器 生产 的 垫圈 的 平均 数 的 差异 依赖 于 垫圈 的 


原料 . 当 这 种 情况 发 生 时 , RINA, 因子 之 间 存 在 交 
互 作用 . 因此 , 析 因 试验 最 重要 目的 之 一 是 发 现 因子 
之 间 的 交互 作用 , 如 果 它 是 存在 的 . 

定义 14.2 在 析 因 试验 中 ， 当 因子 A 的 平均 
水 平 的 差异 依赖 于 因子 B 的 不 同 水 平时 , 我 们 称 因 
子 4 与 甩 有 交互 作用 . 如 果 差 异 与 8 的 水 平 无 关 ， 
那么 A 与 之 间 没 有 交互 作用 . 

只 有 当 因 子 之 间 没 有 交互 作用 时 ， 主 效应 检验 
才 是 恰当 的 . 一 般 地 , 首先 进行 交互 作用 检验 . 如 
果 存 在 因子 交互 作用 的 证 据 ， 那么 将 不 进行 主 效 应 
检验 . 更 确切 地 , 我 们 将 要 集中 注意 力 在 单个 单元 
(处 理 ) 的 平均 值 上 , 也 许 找 出 最 大 或 最 小 的 一 个 
DEI 一 个 原材料 的 日 常 供给 是 变化 旦 有 限 
制 的 公司 , 可 以 用 原材料 按 各 种 不 同 的 比例 生产 两 





种 不 同 的 产品 . 每 单位 原材料 生产 两 种 产品 中 的 每 一 











进行 因子 4 和 因子 8 
之 间 交 互 作用 的 检验 










进行 处 理 均值 
的 多 重 比较 ( 见 
14.8 节 ) 


主 效应 4 
和 主 效应 8 的 









( 见 14.8 节 ) 


双 因子 析 因 试验 的 检验 准则 
种 获得 的 利润 依赖 于 产品 的 制造 流程 的 长 度 ， 
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因此 依赖 于 分 配给 它 的 原材料 量 . 其 他 因子 ， 像 工人 的 生产 效率 和 机 器 的 故障 也 影响 每 单位 利润 ， 
但 是 它们 对 利润 的 净 影响 是 随机 的 且 是 不 可 控 的 . 生产 商 进行 一 次 试验 以 调查 原材料 5 的 供给 水 平 
和 两 条 生产 线 分 配 比 例 RR 对 每 单位 原材料 利润 y 的 影响 . 最 终 目 的 是 能 够 选 出 与 每 天 原材料 供给 5 
匹配 的 最 佳 比例 R. 试验 选择 的 原料 供给 水 平 为 15,18 和 211; 分 配给 两 条 生产 线 的 比例 水 平 是 1/2， 
1 和 2. 响应 是 从 单 日 生产 量 获得 的 每 单位 原材料 供给 的 利润 (美元 ). 以 随机 序列 进行 三 次 重复 的 完 
全 3 x 3 析 因 试验 ( 即 完全 随机 化 设计 ) , 27 天 的 数据 在 表 14.6 中 给 出 . 

a. 号 出 试验 的 完全 模型 . 

b. 数据 提供 充分 的 证 据 表明 供给 S 和 比例 R 之 间 存在 交互 作用 吗 ? Bo =0.05. 

c. 基于 b 中 的 结果 , 我 们 须 进行 主 效应 检验 吗 ? 


表 14.6 例 14.8 的 数据 
原材料 供应 , t( 5) 








15 18 21 
i 23,20,21 22,19,20 19,18,21 
原材料 分 配 比 例 (R) 1 22 ,20,19 24 ,25 ,22 20,19 ,22 
2 


18,18,16 21,23,20 20,22 ,24 


解 
a. 两 个 因子 ,供给 和 比例 都 是 定量 的 . 相应 地 ， 当 析 因 试验 中 的 因子 是 定量 变量 时 ， 主 效应 可 
用 诸如 x, a^, 等 这 样 的 项 表示 . 因为 每 个 因子 都 有 三 个 水 平 ， 对 每 个 因子 需要 两 个 主 效应 x 入?. 
(一 般 地 , 主 效应 项 的 个 数 比 因子 的 水 平 数 少 一 ). 因此 , 3 x3 析 因 试验 的 完全 因子 模型 是 : 
Y 7o + Byxi +B>xl + Bszx +B4x 
Bur ~ 
+ Bsxix) + Boxix +B7x?x2 t Bana) +e 
BST - NIE TERI 
其 中 ,zl = 原材料 供给 (t) ,x, = 分配 比例 . 注意 模型 的 交互 作用 项 是 由 各 种 主 效应 项 ， 即 一 个 因子 与 
每 个 因子 的 乘积 构成 . 例如 , 我 们 引入 了 包含 Xy ^ x, E x2 的 乘积 项 , 其 余 的 交互 作用 项 由 xj RVA 
x5 FU x? RLI x2 而 得 到 . 
b. 为 检验 供给 与 比例 不 存在 交互 作用 的 原 假设 , 必须 检验 在 a 中 的 线性 模型 不 需要 交互 作用 项 
的 原 假设 : 





Hy: Bs 2 Bs - B8; - By =0 
这 要 求 我 们 拟 合 简化 模型 ; 
E(y) 2o +Bixl +B2x? Bax; * Bax 

并 执行 12. 8 节 给 出 的 部 分 检验 . 检验 统计 量 为 ， 

(SSER - SSEc ) /4 
= MSE, 
其 中 ,SSEc = 完全 模型 的 SSE, MSE。 = 完全 模型 的 MSE,SSEA = 简化 模型 的 SSE. 利用 SAS, 对 a 中 的 
抑 全 模型 和 这 里 提出 的 简化 模型 拟 合 表 4.6 中 的 数据 ,SAS 输出 显示 在 图 14. 15a 和 14. 15b 中 . 在 给 





F 
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出 的 阴影 部 分 有 关 的 量 为 : 
SSE, =43.33333 ( 见 图 14.15a) 
MSEc -2.40741 〈 见 图 14. 152) 
SSEr =89.55556 ( 见 图 14.15b) 

将 这 些 值 代 人 检验 统计 量 的 公式 中 , 得 到 


(SEQ -SSEC)/4 _ (89. 55556 -43.33333)/4 | 80 
Ë MSE, 7 2. 40741 l 


这 个 “部 分 "F 值 为 图 14. 15a 的 SAS 输出 底部 的 阴影 部 分 , 检验 的 p 值 为 0.0082, 因为 w =0.05 超出 
T p 值 , 拒绝 Ho, 推断 供给 与 比例 存在 交互 作用 . 

c. 交互 作用 的 存在 说 明 , 平均 利润 依赖 于 供给 5 和 上 比例 R 水 平 的 特定 组 合 . 因此 , 不 是 很 有 必 
要 检查 供给 的 三 个 水 平 的 平均 值 是 否 不 同 , 或 比例 的 三 个 水 平 的 平均 值 是 否 不 同 ( 即 我 们 不 进行 主 
效应 检验 ). 例如 , 给 出 最 高 平均 利润 的 供给 水 平 (对 RR 的 所 有 水 平 ) 可 能 不 是 每 单位 原材料 生产 最 
大 平均 利润 的 供给 - 比例 组 合 . 











Dependent Variable: PROFIT 
finalysis of Variance 
Sum of Mean 
Source DF Squares Square F Value Pr >F 
Model 8 74.66667 9.33333 3.88 0.0081 
Error 18 43.133333 2.40741 
Corrected Total 26 118.00000 
Root MSE 1.55158 R-Square 0.6328 
Dependent Mean 20.66567 ñdj R-Sq 0.48596 
Coeff Var 7.50766 
Parameter Estimates 
Parameter Standard 
Variable DF Estimate Error t Value Pr > iti 
Intercept 1 245.33333 130.49665 1.88 0.0764 
SUPPLY 1 -25.07407 14.71842 -1.70 0.1057? 
SUPPSQ 1 0.57901 0.40837 1.66 0.1137 
RAT IO 1 7534.33333 252.45535 -2.12 0.0485 
RATSQ 1 192.56657 97.17011 1.38 0.0629 
RAT SUPP 1 60.555556 28.47387 13 0.0475 
8 RáTSQ 1 -22.14815 10.95960 -2.02 0.0584 
R SuPPSQ 1 -1.66667 0.79003 -2.11 0.0432 
RSQ_SSQ 1 0.561728 0.30408 2.03 9.0574 


Test INTERACT Results for Dependent Variable PROFIT 


Mean 
Source DF Square F Value Pr >F 
Numerator 4 11.55556 35.80 0.0082 
Denon inator 18 2.40741 


Test HIGHORDR Results for Dependent Variable PROFIT 


Mean 





Source DF Square F Value Pr >F 
Numerator 3 3.71958 1.55 — 2378 
Denominator 18 2.40741 








a) 完全 析 因 模型 的 SAS 回归 输出 
图 14.15 模型 的 SAS 回归 输出 
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Dependent Variable: PHUF IT 


finalysis of Variance 


Sum of Mean 

Source DF Squares Square F Value Pr >F 
Model 4 28.44444 7.11111 1.75 0.1757 
Error 22 89 55556 4.07071 
Corrected Total 26 118.00000 

Root MSE 2.01760 R-Square 0.2411 

Dependent Mean 20.866667 fidj R-8q 0.1031 

Coeff Var 9.76258 


Parameter Estimates 








Parameter Standard 
Variable DF Estimate Error t Value Pr > It! 
Intercept 1 -43.48148 29.32961 =1.48 0.1524 
SUPPLY 1 6.81481 3.29854 2.07 0.0508 
SUPPSQ 1 -0.18519 0.09152 -2.02 0.0553 
RATIO 1 5.66667 4.35851 1.30 0.2070 
RATSQ 1 -2.23630 1.67759 -1.37 0.1849 





b) 简化 析 因 模型 的 SAS 回归 输出 
图 14.15 ( 续 ) 


分 析 “水 平 的 因子 4 F b 水 平 的 因子 B 的 完全 双 因 子 析 因 试验 的 传统 方差 分 析 方 法 利用 将 总 的 


SS(B)、SS(4B) 和 SSE( 见 图 14. 16) 的 事实 . 前 
因子 8 的 主 效应 平方 和 SS(B) 


两 个 平方 和 SS(4) 和 SS(B) 称 为 主 效应 平方 和 ， 
以 区 别 于 交互 作用 平方 和 SSCAB). 

因子 4 与 3 之 间 交互 作用 的 平 
方 和 SS(48) 


因为 方差 分 析 的 平方 和 与 自由 度 是 可 加 的 ， 

方差 分 析 表 如 下 面 所 示 . 注意 检验 因子 主 效应 和 

因子 交互 作用 的 到 统计 量 分 别 由 适当 的 均 方 除 以 
MSE 得 到 的 . 感 兴趣 检验 的 分 子 自 由 度 等 于 被 检 。 图 14.16 完全 双 因 子 析 因 试 验 的 总 平方 和 分 解 
验 的 变 差 来 源 自由 度 ; 分 母 自 由 度 总 是 等 于 误差 自由 度 











总 平方 和 SS( 总 ) 








每 个 单元 7 个 观测 值 的 a x b 析 因 试 验 的 ANOVA x 


(3E:n-axbxr) 





来 源 df SS MS F 

主 效应 4 (a-1) SS(A) MS(A) =SS(4)/(a-1) MS(A)/MSE 
主 效 应 B (b-1) SS(B) MS( B) -SS(B)/(5 —1) MS( B)/MSE 
AB 交互 作用 (a-1)x(b-1) SS(AB) MS(AB) =SS(AB)/[ (a-1)(b-1)] — MS(AB)/MSE 
误差 ab(r-1) SSE MSE = SSE/[ ab(r -1)] 





总 和 abr -1 SS( &) 
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这 些 玉 检验 等 价 于 拟 合 回归 中 的 完全 和 简化 模型 得 到 的 下 检验 . O 
为 了 完整 性 , 计算 完全 双 因 子 析 因 试验 的 ANOVA 平方 和 的 公式 在 下 面 框 格 中 给 出 . 





双 因 子 析 因 试验 的 ANOVA 计算 公式 


( Yo 
(所 有 nn 个 测量 值 之 和 )” c6 
CM = 均值 的 修正 = z " = 一 








SS( 总 ) = 总 平方 和 = (所 有 测量 值 的 平方 和 ) -CM = Yt = CM 
SS(4) = 主 效 应 自 变量 1 的 平方 和 (A,A, A, 的 平方 和 除 以 单个 和 的 观测 信 个 数 ( 即 br) 的 和 ) -CM 


Ya 
= or - CM 
SS(B) = 主 效应 自 变量 2 的 平方 和 = CR B,, Be, B, 的 平方 除 以 单个 和 的 观测 值 个 数 ar 之 和 ) - CM 
b 
B? 


= 一 一- CM 


ar 
SS(AB) = AB 交互 作用 的 平方 和 
= (4Bi1 , 4Bis,…, 4Bw 单 元 和 的 平方 除 以 单个 和 的 测量 值 个 数 > 之 和 ) -SS(4) - SS(B) - CM 























- SS(A) - SS(B) - CM 


其 中 : 

a= 自 变量 1 的 水 平 数 . 

b= 自 变量 2 的 水 平 数 . 

r= 自 变量 1 和 自 变量 2 每 个 水 平 组 合 的 测量 值 个 数 . 

= 测量 值 的 总 个 数 =a xb xr. 

A, = 自 变量 1 在 水 平 i 的 所 有 测量 值 总 和 (i=1,2,…,a). 

B= 自 变量 2 £ kE j 的 所 有 测量 值 总 和 (j=1,2,…,5). 

AB,- BEE 1 在 水 平 i, 自 变量 2 在 水 平 j 的 所 有 测量 值 的 总 和 (i=1,2,…,a; j=1,2,.",0). 





























参见 例 14. 8. 


a. 构造 分 析 的 ANOVA 汇总 表 . 





O 仅 当 简 化 模型 包含 交互 作用 项 时 , 框 格 给 出 的 主 效应 ANOVA 下 检验 等 价 于 回归 方法 的 尸检 验 . 因为 主 效应 检验 通常 
在 确定 交互 作用 项 是 不 显著 之 后 , 一 些 统计 学 家 喜欢 在 进行 主 效应 检验 之 前 ， 从 完全 模型 和 简化 模型 中 删 掉 交互 作用 
项 . 例如 , 为 检验 主 效应 A, 完全 模型 包含 4 和 8B 的 主 效应 项 , 而 简化 模型 只 包含 B 的 主 效应 项 . 为 了 用 ANOVA 方法 
得 到 等 价 的 结果 , AB 交互 作用 项 和 误差 的 平方 和 “合并 ”成 一 个 计算 新 的 MSE, 其 中 


| SS(AB) + SSE 
" n-a-b41^ 








MSE 
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b. 用 传统 的 方差 分 析 方法 进行 供给 x 比例 交互 作用 的 检验 . 

解 

a. 尽管 给 出 的 公式 是 直接 的 , 但 用 起 来 却 是 相当 厌烦 的 . 因此 , 我 们 求助 于 统计 软件 包 进 行 
ANOVA. ANOVA 的 MINITAB 输出 在 图 14. 17 中 给 出 . 输出 中 着 重 显示 的 是 汇总 的 ANOVA 表 . 


| Two-way ANOVA: PROFIT versus SUPPLY, RATIO 


Source DF ss MS E P 
SUPPLY 2 20.222 10.1111 4.20 0.032 
RATIO 2 8.222 4.1111 1.71 0.209 
Interaction 4 46.222 11.5556 4.80 0.008 
Error 18 43.333 2.4074 
Total 26 118.000 


3 = 1:552 R-Sq = 63.285 R-Sq(adj) = 46.96s | 
图 14. 17 完全 析 因 设计 ANOVA 的 MINITAB 输出 


b. 为 了 检验 供给 和 比例 交互 作用 的 假设 , 用 检验 统计 量 


F- OD z n =4. 80( 在 MINITAB 输出 的 “Interaction” 行 中 给 出 ) 


注意 ,这 个 值 等 于 例 14.8 中 用 回归 方法 得 到 的 检验 统计 量 . 检验 的 p 值 ( MINITAB 输出 的 阴影 部 分 ) 
为 0. 008， 因 为 这 个 值 也 小 于 所 选 的 a =0.05 值 ， 所 以 我 们 推断 供给 和 比例 之 间 存在 交互 作用 . 

本 章 中 ,给 出 两 种 分 析 设计 的 试验 数据 方法 ; 回归 方法 和 传统 的 ANOVA 方法 . 在 析 因 试验 中 
当 因子 都 是 定性 时 ,这 两 种 方法 得 到 同样 结果 ; 然而 , 当 因子 中 至 少 有 一 个 是 定量 时 ,回归 方法 会 提 
供 更 多 的 信息 . 例如 , 在 例 14.9 中 的 方差 分 析 只 对 9 个 供给 - 比例 水 平 组 合 估计 每 单位 供给 的 平均 
利润 , 它 不 允许 估计 不 包含 在 析 因 试验 中 所 用 的 9 种 之 内 的 其 他 变量 水 平 组 合 的 平均 响应 . 另外 ,由 
例 14.8 回归 分 析 得 到 的 预测 方程 使 我 们 能 够 估计 当 (S = 17, R 21) 每 单位 供给 的 平均 利润 我 们 不 
能 由 例 14.9 的 方差 分 析 得 到 这 个 估计 

由 回归 分 析 得 到 的 预测 方程 也 贡献 了 不 能 由 传统 的 方差 分 析 方法 提供 的 信息 . 例如 ,对 S, R B 
单位 变化 , 或 对 $ 和 下 的 特定 值 , 可 能 希望 估计 平均 利润 EO) 的 变化 率 . 或 者 , 想 确定 例 14.8 的 完 
全 模型 中 的 三 阶 和 四 阶 项 是 否 对 利润 y 的 预测 真正 提供 了 附加 的 信息 . 

在 本 节 的 最 后 两 个 例 中 介绍 某 些 应 用 . 
| 例 14. 10 | 数据 能 否 提供 足够 的 信息 表明 例 14. 8 的 完全 因子 模型 中 的 三 阶 和 四 阶 项 对 利润 的 预 
测 供 献 了 信息 ? 用 a =0.05 检验 . 

解 如 果 对 问题 的 回答 是 “是 “， 则 完全 因子 模型 中 的 参数 66 ,6 , 或 Bs 中 至 少 有 -个 不 等 于 0 
( 即 它们 都 是 模型 中 所 需 的 ). 因此 , 原 假设 为 

Ho: Bg 2 B; - 8g =0 



























备 择 假 设 为 
H,: =?" p 参数 中 至 少 有 一 个 不 为 0 
为 检验 这 个 假设 ， 计算 合适 的 简化 模型 和 完全 模型 的 SSE 的 差 . 
对 这 个 应 用 , 完全 模型 是 例 14.8 的 完全 因子 模型 . 
完全 模型 :E(y) 2 Bo e Bux, By +Bsx + Bax5 + Bsxi x, Bex 12 * Bx 1x + Baxix 


简化 模型 是 完全 模型 减 去 三 阶 和 四 阶 项 ， 即 简化 模型 是 二 阶 模型 
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简化 模型 : E(y) — Bo +B1x1 Box] +B3x2 Bax * Bsxix, 

回忆 (从 图 14. 15a) 完全 模型 的 SSE 和 MSE 分 别 为 SSE = 43. 3333, MSE - 2. 407 4. 简化 模型 回 
归 分 析 的 SAS 输出 见 图 14. 18 , 简化 模型 的 SSE( 阴影 部 分 ) 为 SSER =54. 49206. 因此 ,进行 这 个 检验 
所 要 求 的 检验 统计 量 为 ， 

检验 统计 量 ， . ' 

(SSEn -SSEc )/ 检 验 的 B 个 数 (54. 49206 - 43. 3333)/3 
F= MSEc = 2.4074 

部 分 F AEETI JH SAS 的 选项 得 到 , 在 图 14. 15a 完全 模型 的 SAS 输出 底部 给 出 ， 检 验 的 EE 
表示 ) 0.2373. 





=1.55 





Dependent Variable: PROFIT 
finalysis of Var iance 
Sun of Mean 
Source DF Squares Square F Value Pr >F 
tode I 5 63.50794 12.70159 4.83 0.0040 
Error 21 54.49208 2.59486 
Corrected Total 26 118.00000 
Root MSE 1.61086 R-Square 0.5382 
Dependent Mean 20.66667 fidj R-Sq 0.4283 
Coeff Var 7.79447? 
Parameter Estimates 
Parameter Standard 
Variable DF Estimate Error t Value Pr > iti 
Intercept 1 -27.81481 23.80152 -1.17 0.2557 
SUPPLY 1 5.94444 2.64418 2.25 0.0354 
RATIO 1 -7.75190 5.04523 -1.54 0.1389 
RAT SuPP 1 0.74503 0.20295 3.68 0.9014 
UPPSQ 1 70.18519 0.07307 -2.53 0.0193 
RATSQ 1 -2.29630 1.33939 ~1.71 0.1012 











图 14.18 简化 (二 阶 ) 因子 模型 的 SAS 回归 输出 


结论 : 因为 a=0.05 小 于 p ff =0.2373， 所 以 我 们 不 能 拒绝 原 假设 Be = pg; = s = 0. 就 是 
说 , 没有 充分 的 证 据 (在 w =0.05) 表 明 与 B。，, B), B 关联 的 三 阶 和 四 阶 项 对 利润 y 的 预测 能 提 
供 信息 . 因为 完全 因子 模型 关于 y 不 比 简化 (二 阶 ) 模 型 提供 更 多 的 信息 ， 所 以 在 实践 中 推荐 使 
用 二 阶 模型 . 
用 例 14. 10 的 二 阶 模型 求 当 $ = 17, R=1 时 ,每 单位 原料 供给 的 平均 利润 的 95% 置信 
区 间 . 

解 图 14.19 是 一 阶 模型 的 SAS 输出 中 关于 E(y) 的 95% 置信 区 间 的 部 分 . ES SIT, R=] 
BP, E(y) 的 属 信 区 间 在 输出 的 最 后 一 行 的 阴影 部 分 , 可 以 看 出 区 间 为 (20.97， 23.72). 因此 , f 
计 ( 管 信 系数 为 0.95) 当 $=17, R=1 时 , 每 单位 供给 的 平均 利润 落 在 (20.97， 23.72) 之 间 . 除了 
这 个 直接 的 结果 , 应 注意 这 个 例子 表明 回归 分 析 的 能 力 和 多 功能 性 . 特别 地 ， 没有 办 法 从 例 14.9 
中 的 方差 分 析 得 到 这 个 估计 . 然而 , 一 个 计算 机 的 回归 程序 包 可 以 容易 自 动 运行 包含 置信 区 间 的 
程序 
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Dep Var Predicted Std Error 
Dbs SUPPLY RATIO PROF IT Value llean Predict 957 CL Mean Res 1dual 
1 15 0.5 23.0000 20.8254 0.8033 19.1549 22.4959 2.1746 
2 15 0.5 20.0000 20.8254 0.8033 19.1549 22.4953 -0.8254 
3 15 0.5 21.0000 20.8254 0.8033 19.1543 22.4959 0.1746 
4 18 0.5 22.0000 21.4444 0.5932 20.0029 22.8850 0.5556 
5 18 9.5 13.0000 21.4444 0.6932 20.0029 22.8850 -28.4444 
5 18 0.5 20.0000 21.4444 0.6932 20.0029 22.8860 -1.4444 
? 21 0.5 19.0000 18.7302 0.8033 17.05968 — 20.4007 0.2698 
8 21 0.5 18.0000 18.7302 0.8033 17.0596 20.4007 -0.7302 
9 21 0.5 21.0000 18.7302 0.8033 17.0596 20.4007 2.2698 
10 15 1 22.0000 20.8175 0.7005 19.3605 22.2744 1.1825 
11 15 1 20.0000 20.8175 0.7006 9.3605 22.2744 -0.8175 
12 15 1 19.0000 20.8175 0.7006 19.3605 22.2744 -1.8175 
13 18 1 24.0000 22.5556 0.6932 21.1140 23.9971 1.4444 
14 18 1 25.0000 22.5556 0.6932 21.1140 23.9971 2.4444 
15 18 1 22.0000 22.5556 0.5932 21.1140 23.9971 -0.5556 
16 21 I 20.0000 20.9603 0.7006 19.5034 22.4173 -0.9603 
17 21 1 19.0000 20.9603 0.7006 19.5034 22.4173 -1.9603 
18 21 1 22.0000 20.9503 0.7005 19.5034 22.4173 1.0397? 
13 15 2 18.0000 17.3571 0.8530 15.5797 19.1436 0.6429 
20 15 2 18.0000 17.3571 0.8590 15.5707. 19.1436 0.6429 
21 15 2 16.0000 17.3571 0.8590 15.5707 13.1436 -1.3571 
22 18 2 21.0000 21.3333 0.5932 19.8317 22.7749 -0.3333 
23 18 2 23.0000 21.3333 0.6932 19.8917 22.7749 1.6667 
24 18 2 29.0000 21.3333 0.5932 19.8917 22.7749 -1.3333 
25 21 2 20.0000 21.9762 0.8590 20.1897 23.7627 -1.9762 
26 21 2 22.0000 21.9762 0.8590 20.1897 23.7627 0.0238 
er 21 2 24.0000 21.9762 0.8590 20.1897 23.7627 2.0238 
28 17 1 . 22.3465 0.5625 20.9687 23.7244 














图 14. 19 简化 (二 阶 ) 因子 模型 的 置信 区 间 的 SAS 输出 


(9) 应 用 练习 


14.23 面包 酵 母 和 酿酒 酵母 . 参见 练习 13. 8, Electron- 
ic Journal of Biotechnology( 2003 年 2 月 15 日) 对 两 种 
酵母 膏 ( 面 包 酵 母 和 酿酒 酵母 ) 的 研究 . 回忆 两 种 
酵母 膏 样 本 是 在 4 个 不 同 温度 (45 所 ,48% ，513C ， 

544 ) 下 制备 的 , 且 在 每 个 酵母 - 温度 组 合 水 平 下 

测量 自 洲 率 (记录 为 百分数 ). 因此 用 2 x4 的 析 因 

设计 , 两 水 平 的 酵母 (面包 酵母 和 啤酒 酵母 菌 ) 和 

四 水 平 的 温度 . 

a. 对 这 个 设计 , 给 出 酵母 育 和 温度 之 间 交 互 作用 

的 实际 解释 , 用 图 说 明 . 

如 果 不 存在 交互 作用 , 重新 画 a 中 图 . 

. 写 出 一 个 对 分 析 数 据 是 恰当 的 平均 自 溶 率 E( y) 
的 完全 模型 . 

d. 给 出 检验 交互 作用 的 原 假 设 和 备 择 假设 , 解释 
如 何 用 回归 进行 这 个 检验 . 

e. 一 个 ANOVA 得 到 交互 作用 的 p 值 为 0.0027, 用 
a =0.05 解释 这 个 结果 的 实际 意义 . 

f 对 用 回归 方法 检验 酵母 襄 和 温度 的 主 效 应 , 给 
出 原 假设 和 备 择 假设 , 解释 如 何 用 回归 进行 这 
些 主 效应 检验 . 

g. 为 什么 f 的 检验 不 应 该 进行 ? 

14.24 基于 虚拟 现实 的 恢复 系统 . 参见 练习 14. 8. 

Robotica ( Vol. 22, 2004 年 ), 3 种 基于 虚拟 现实 

(VR) 的 手 恢 复 系统 显示 设备 有 效 性 的 研究 . 演示 


s 


° 


14.25 


设备 A 是 投影 仪 , 设备 B 是 台式 计算 机 监视 仪 ， 

设备 C 是 头盔 显示 器 . 回忆 选择 12 个 惯用 右手 的 

无 残疾 男性 受 试 者 ,随机 指派 3 种 VR 显示 设备 ， 

每 组 4 个 受 试 者 . 另外 , 在 每 组 中 随机 指派 两 个 受 

试 者 使 用 辅助 的 左右 逆转 影像 ， 另 两 个 则 不 使 用 . 

因此 , 用 3 x2 析 因 设计 , 三 水 平 (A.B 或 C) 的 VR 

显示 设备 , 两 水 平 ( 有 或 无 ) 的 辅助 左右 逆转 影 

每 个 受 试 者 用 指派 的 VR 系统 执行 “ 抓 放 ” 程 序 ， 

记录 碰撞 频数 (移动 物体 间 的 碰撞 次 数 ). 

a. 在 这 个 设计 的 ANOVA 汇总 表 中 给 出 变异 来 源 
及 关联 的 自由 度 . 

b. 写 出 分 析 这 些 数 据 的 完全 模型 ,a 中 每 个 来 源 
的 自由 度 应 当 与 模型 中 那个 来 源 的 虚拟 变量 项 
个 数 一 致 . 

c. 下 面 给 出 因子 ANOVA 得 到 的 p 值 : 显示 主 效应 
(0.045) 、 辅 助 左 右 逆转 影像 主 效 应 (0.003) 、 
交互 作用 (0.411). 从 实际 角度 解释 这 些 结果 ， 
对 进行 的 每 个 检验 都 用 a =0.05. 

“如 路 ”试验 . 在 一 个 复杂 的 建筑 物 中 , 指引 

新 来 者 去 某 个 特定 位 置 的 最 好 方法 是 什么 ? 波 尔 

州立 大 学 (印第安 那 ) 研究 人 员 对 这 个 “ 寻 路 "问题 

进行 了 探讨 , 并 在 Human Factor(1993 年 3 月 ) 中 

报告 了 他 们 的 结果 . 在 一 个 多 层 大 楼 中 , 接受 试验 

的 人 在 开始 的 房间 中 集合 , 然后 让 他 们 尽 可 能 快 

些 找到 “目标 ”房间 .〈 其 中 一 些 受 试 者 提供 了 定向 

帮助 ， 而 另 一 些 没有 ) 在 抵达 他 们 的 目标 后 , 受 试 
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者 立即 回 到 开始 的 房间 , 然后 再 给 一 个 寻找 的 第 
二 个 房间 ( 目标 房间 之 一 位 于 大 楼 的 东 端 , 另 一 个 
位 于 西端 ). 在 这 个 研究 中 试验 的 可 控 变 量 是 三 水 
平 (符号 、 地 图 、 没有 帮助 ) 的 帮助 类 型 ， 两 水 平 
( 东 / 西 , 西 / 东 ) 的 房间 次 序 . 受 试 者 随机 指派 到 
3 x2=6 个 试验 条 件 之 一 , 记录 行进 的 时 间 (s)， 
对 这 个 3 x2 析 因 设 计 的 东 面 房间 数据 的 分 析 结 果 
在 表 中 给 出 ,并 解释 这 个 结果 . 


来 源 df MS F P 值 


帮助 类 型 2 511323.06 76.67 <0.0001 
房间 次 序 1 13 005. 08 1.95 >0.10 
帮助 x 次序 2 8573. 13 1.29 >0.10 
误差 46 6668. 94 
资料 来 源 : Butler,D. L. , et al. “ Wayfinding by newcomers in 
a complex building. ” Human Factors, Vol. 35, No. 1, 1993 
年 3 月 ， p.163( X 1). 


14.96 Bé N EXE L E E48 <. 在 被 冲 到 新 西 兰 
90 哩 海滩 的 漂浮 物 中 有 大 量 贻 贝 幼体 ,这 些 幼 体 
倾向 寄居 于 藻类 . 奥克兰 大 学 的 环境 学 家 研究 藻类 
类 型 对 漂浮 物 中 贻 贝 幼体 丰富 性 的 影响 ，( Malaco- 
logia, 2002 年 2 月 8 日 ) 收 集 了 90 哩 海滩 上 来 自 三 
次 不 同 冲 蚀 事 件 的 漂浮 物 ; 对 每 次 冲 蚀 将 幼体 分 
为 4 层 ( 粗 枝 、 中 间 枝 、 细 枝 和 蝙 状 幼体 )， 从 
3 x4 =12 种 事件 / 层 组 合 的 每 一 种 中 随机 选择 两 个 
样本 , 记录 每 个 样本 中 贻 贝 的 密度 (每 平方 厘米 的 
百分比 ). 用 3 x4 = 12 完全 析 因 设计 分 析 数 据 . 





ANOVA 表 在 下 面 给 出 . 
来 源 df F p f& 
事件 2 0. 35 »0.05 
ER 3 217. 33 »0.05 
交互 作用 6 1.91 >0. 05 
误差 12 f 
总 和 23 
5> 


a. 指出 试验 中 的 因子 (及 水 平 ). 

b. 试验 中 包含 多 少 个 处 理 ? 

c. 试验 中 包含 多 少 次 重复 ? 

d. 试验 的 总 的 样本 大 小 是 什么 ? 

e. 被 测量 的 响应 变量 是 什么 ? 

f. 首先 进行 哪个 ANOVA F 检验 ?进行 这 个 检验 
(a 20.05) , 并 解释 结果 . 

E MRE, 对 主 效应 进行 检验 (a =0.05), 解 
释 结果 . 

14.27 学 生 利用 计算 机 实验 宝 . 奥 科 拉 哈 玛 大 学 的 


计算 机 实验 室 是 一 周 7 天 , 一 天 24h 开放 . 在 Pro- 
duction and Inventory Management Journal (1999 年 第 
3 季度 ) 中 , S. Barman 研究 计算 机 的 使 用 (1) 在 一 
周 的 7 天 中 ; (2) 在 一 天 的 24h 中 是 否 有 明显 的 不 
同 . 利用 学 生 的 注销 记录 , 收集 7 天 时 间 中 的 每 小 
时 学 生 负 荷 数据 (每 小 时 用 户 人 数 ). 下 表 给 出 运 
行 析 因 ANOVA 的 结果 . 

来 源 d SS MS F p 值 
天 6 18732.13 3122.02 68.39 0.0001 
时 间 23 164629.86 7157.82 156.80 0.0001 
天 x 时 间 138 7685.22 55.69 1.22 0.0527 


资料 来 源 :Barman,S. ^A statistical analysis of the attendance 
pattern of a computer laboratory. " Production and Inventory 
Management Journal ,3rd Quarter , 1999 , pp. 26-30. 


a. 这 是 一 个 观测 的 还 是 设计 的 试验 ? 解释 . 

试验 中 的 两 个 因子 是 什么 ,每 个 因子 的 水 平 是 
多 少 ? 

e. 这 是 一 个 a xb 因子 试验 , a 和 56 分 别 是 什么 ? 

d. 确定 用 于 检验 研究 的 两 个 因子 之 间 交 互 作用 效 
应 的 原 假设 和 备 择 假设 . 

进行 d 的 检验 , 用 a =0.05, 结合 问题 的 内 容 解 
FAR. 

f. 如 果 适当 , 对 天 和 时 间 进 行 主 效应 检验 , 用 a = 
0.05, 结合 问题 的 内 容 解释 结果 . 


t- 


e 
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55 - 铅 焊 料 中 替代 较 昂 贵 的 锡 ， 从 而 降低 焊接 的 

成 本 . 进行 一 个 析 因 试验 确定 匀 是 如 何 影响 锡 - n 

焊接 强度 (Journal of Materials Science, 1986 年 5 

H). 用 4 种 可 能 的 冷却 方式 : 水 冷 WQ; 油 

冷 一 一 08; 气 吹 一 一 AB; 炉 内 冷却 一 _FC， 以 及 

加 到 合成 物 的 4 种 可 能 锐 量 (0% ,3% ,5% 和 10% ) 

之 一 制备 锡 - 铅 焊 料 样 品 . 三 次 焊接 被 随机 指派 到 

4x4=16 个 处 理 中 的 每 一 个 , 并 测量 每 次 抗 前 强 

度 . 对 附 表 中 给 出 的 试验 结果 进行 ANOVA. 

a. 对 试验 构造 ANOVA 汇总 表 . 

bp. 进行 检验 确定 两 个 因子 ( 匀 量 和 冷却 方法 ) 是 否 
有 交互 作用 , 用 o =0.01 检验 . 

c. 解释 b 中 得 到 的 结果 . 

d. 如 果 适 当 , 用 a =0.01, 进行 主 效应 检验 . 








HR% 重量 冷却 方法 抗 前 强度 ( MPa) 
0 WQ 17.6,19.5,18.3 
0 0Q 20.0,24.3,21.9 
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( 续 ) d. 数据 是 否 提供 充分 的 证 据 表明 分 析 方 法 和 实验 
bio 重量 冷却 方法 T1895 SE ( MPa) 室 之 间 有 交互 作用 ? 用 a =0. 05 检验 . 
0 AB 18. 3,19. 8,22.9 e. 数据 是 否 提供 充分 的 证 据 表明 不 同 实验 室 读 出 
0 FC 19. 4,19. 8,20. 3 的 硫 含量 平均 水 平 是 不 同 的 ? 用 w -0.05 检验 . 
3 WO 18.6.19.5.19.0 f. 数据 是 否 提 供 充 分 的 证 据 表明 两 种 分 析 方 法 之 
3 oQ 20.0,20.9,20.4 dus LA ILADVHDIOHES VE S 用 a = 0.05 
3 AB 21.7,22.9,22.1 kasa 
3 FC 19.0,20.9,19.9 
5 WQ 22. 3 ,19. 5,20. 5 实验 室 
5 0Q 20. 9,22. 9,20. 6 L L L L L k L 
5 AB 22.9,19.7,21.6 分 析 的 ^v 0.107 0.127 0.115 0.108 0.097 0.114 0.155 
5 FC 19. 6,16. 4,20. 5 方法 — 9105012 0.112 0.108 0.0% 0.119 0.145 
10 wo 15. 2,17. 1,16. 6 分 析 的 42 0.105 0.127 0.109 0.117 0.110 0.116 0.164 
10 0Q 16.4,19.0,18.1 方法 
0.103 0.124 0.111 0.115 0.097 0.122 0.160 
10 AB 15. 8,17.3,17.1 - - — —— - — 
10 FC 16.4 17.6 17.6 资料 来 源 : Taguchi, G. "Signal noise ratio and its application for 


资料 来 源 : Tomlinson, W. J. , and Cooper, G. A. " Fracture 
mechanism of brass/Sn-Pb-Sb solder joints and the effect of 
production variables on the joint strength. " Journal of Materi- 
als Science , Vol. 21, No. 5, May 1986, p. 1731 ( Table II ). 
Copyright 1986 Chapman and Hall. 


14.29 煤 中 的 硫 含 量 . 进行 一 项 研究 调查 两 个 因子 
对 煤 中 硫 含 量 的 平均 水 平 的 影响 : 进行 分 析 的 实 
验 室 (7 个 水 平 ) 和 分 析 的 方法 (2 个 水 平 ). 试验 所 
用 的 28 个 煤 样品 全 都 来 自 同一 产地 ， 随 机 指派 两 
个 样品 到 7 x2 个 实验 室 和 分 析 方 法 组 合 中 的 每 一 
+. 对 下 表 给 出 的 数据 进行 方差 分 析 . 

a. 指出 试验 中 的 处 理 . 

b. 分 析 方 法 和 实验 室 之 间 的 交互 作用 的 实际 显著 
性 是 多 少 ? 

c. 构造 ANOVA 汇总 表 . 


testing material.” Reports of Statistical Application Research ; 
Union of Japanese Scientists and Engineers. Vol. 18, No. 4 ,1971 
4E. p. 21-33. 


14.80 发 现 零件 的 早期 故障 . 某 大 型 国防 承包 单位 
的 质量 部 门 进行 了 一 个 考虑 变压器 零件 检查 和 测 
试 的 权衡 研究 , 安排 调查 以 查验 各 种 检查 水 平和 
即将 测试 的 时 间 对 发 现 早 期 零件 故障 或 疲劳 的 影 
响 . 所 选 的 检查 水 平 为 完全 军事 检查 (4) 、 放 宽 的 
军事 规格 水 平 (B) 及 商业 等 级 (C). 这 个 研究 选择 
的 执行 老化 测试 时 间 为 从 1 ~9h, 增 量 为 1h, 响 
应 是 取 自 检查 批 大 小 达到 某 个 指定 水 平 ， 并 在 预 
先 规定 的 时 间 长 度 内 老化 的 样本 中 得 到 的 每 1000 
台 的 故障 数 . 在 每 种 条 件 下 , 以 随机 顺序 重复 三 次 
进行 3 x9 完全 析 因 试验 ( 共 81 个 观测 值 ). 对 此 研 
究 的 数据 ( 列 在 表 中 ) 利 用 SAS 进行 ANOVA, SAS 
输出 如 下 , 分 析 并 解释 结果 . 














老化 (h) 完全 军事 规格 , 4 放宽 的 军事 规格 水 平 , B 商业 等 级 , C 
1 7.60 7.50 76 | 7% 7.10 7.20 6. 16 6.13 6.21 
2 6. 54 7.46 6. 84 5.85 6.15 6. 15 6.21 5.50 5. 64 
3 6. 53 5. 85 6. 38 5.30 5.60 5.80 5.41 5.45 5.35 
4 5.66 5. 98 5.37 5.38 5.27 5.29 5.68 5.47 5.84 
5 5.00 5.27 5.39 4.85 4.99 4.98 5.65 6. 00 6.15 
6 4.20 3. 60 420 | 450 4. 56 4.50 6. 70 6.72 6. 54 
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完全 军事 规格 , 4 





放宽 的 军事 规格 水 平 , B 





商业 等 级 , C 



































7 3.66 3.92 4.22 3.97 
8 3.76 3. 68 
9 3. 46 3. 55 3. 45 








3.90 


3. 86 


5.63 




















3.84 7.90 7.47 7.70 
4.46 8.40 8.60 7.90 
5.25 8. 82 9.76 9. 52 











资料 来 源 ; La Nuez, Danny, College of Business Administration, graduate student, University of South Florida, 1989— 1990. 





Dependent Variable: FAILURES 





The ANOVA Procedure 








数 , 9 水 平 的 氮 -水 混合 物 的 温度 . 数据 在 表 中 
给 出 . 











H,0 的 摩尔 分 数 
温度 (K) 

0. 0022 0.017 0.08 
1000 1.68 1.69 1.72 
1100 1.98 1.99 2.02 
1200 2.30 2.31 2.35 
1300 2.64 2. 65 2. 70 
1400 3.00 3.01 3. 06 
1500 3.38 3.39 3. 45 
1600 3.78 3.79 3.85 
1700 4.19 4.21 4.27 














Sum of 
Source Dr Squares Mean Square F Value Pr > F 
Model 26 168.6120667 6.4850795 101.31 <.0001 
Error 54 3.4565333 0 . 0640099 
Corrected Total 80 172.0686000 
R-Square Coeff Var Boot MSE FAILURES Mean 
0.979312 4.405990 0.253002 5.742222 
Source DF nova SS Mean Square F Value Pr > F 
BURN IN 8 27.97440000 3.49680000 54.63 <.0001 
INSLEVEL 2 43.08411852 21.54205926 336.54 €.0001 
= BURN IN* INSLEVEL 16 97.55354815 6.09709676 95.25 <.0001 
练习 14.30 的 SAS 输出 
14.91 石墨 的 燃烧 率 . 作为 研究 在 潮湿 空气 流 中 人 (X) 
AÉ-£1 BS BEER SEES] — SEA, 研究 人 员 进 行 一 项 试 H,O 的 摩尔 分 数 
验 调查 氧气 通过 水 气 混合 物 的 扩散 能 力 . 进行 一 温度 (K) — TD T Do 
个 3 x9 的 析 因 试验 , 3 水 平 的 水 (H,0) 的 摩尔 分 
1800 4.63 4.64 4.71 


资料 来 源 : Matsui, K. , Tsuji, H., and Makino, A. "The 
effects of water vapor concentration on the rate of combustion of 
an artificial graphite in humid air flow." Combustion. and 
Flame,Vol. 50, 1983, pp. 107-118 Copyright 1983 by The 
Combustion Institute. Reprinted by permission of Elsevier Sci- 
ence Publishing Co. ,Inc. 


a. 解释 为 什么 传统 的 (用 ANOVA 公式 ) 方 差分 析 
不 适用 于 这 些 数据 的 分 析 ? 

b. 绘制 数据 图 ,确定 对 平均 氧气 扩散 量 E(y) 的 一 
阶 或 二 阶 模型 是 否 更 恰当 . 

o. 写 出 联系 平均 氧气 扩散 量 E(y) 与 温度 <, ( E 
BE) 和 摩尔 分 数 坊 ( 千 分 之 一 ) 的 交互 作用 模型 

d， 假 定 温度 与 摩尔 分 数 没有 交互 作用 ,对 于 EO) 
与 “和 ;之 间 的 关系 , 这 意味 着 什么 ? 

e. 数据 是 否 提供 充分 的 信息 表明 温度 与 HO KE 
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尔 分 数 有 交互 作用 ? 用 附 随 的 MINITAB 输出 结 时 , 代入 预测 方程 ， 预测 平均 扩散 量 . 
果 进 行 a = 0.05 检验 . h， 当 过 程 的 温度 为 1300K, 水 的 摩尔 分 数 为 0.017 
f. 给 出 E(y) 的 最 小 二 乘 预 测 方程 . 时 , 在 MINITAB 的 输出 中 , 找 出 平均 扩散 量 的 
g. 当 过 程 的 温度 为 1300 K, 水 的 摩尔 分 数 为 0.017 95% 置信 区 间 . 解释 这 个 结果 . 
The regression equation is 
OXYDIFF = - 2.10 + 0.00368 TEMP - 0.24 MOLE + 0.00073 TEMPMOLE 
Predictor Coef SE Coef T P 
Constant -2.09528 0.09035 -23.19 0.000 
TEMP 0.00368411  0.00006347 58.05 0.000 
MOLE -0.238 1.913 -0.12 D.902 
TEMPMOLE 0.000733 0.001344 0.55 0.591 
3 = 0.06081 R-8q = 99.7& R-Sq(adj) = 99.65 


Analysis of Variance 


Source DF 33 HS F P 
Regression 3 24.7733 8.2578 2233.31 0.000 
Residual Error 23 0.0850 0.0037 

Total 26 24.8583 


Predicted Values for Mew Observations 


New Obs Fit SE Fit 95.05 CI 95.0% PI 
1 2.7062 0.0139 { 2.6774, 2.7350) ( 2.5772, 2.8352) 


Values of Predictors for New Observations 


New Obs TEMP MOLE  TEMPMOLE 
1 1300 0.0170 22.1 











练习 14.31 的 MINITAB 输出 


'14.6 更 复杂 的 析 因 设 计 


在 本 节 中 , 我 们 给 出 一 些 , 比 14. 5 节 基 本 的 两 因子 析 因 试验 更 复杂 的 有 用 的 析 因 设计 . 这 些 设 
计 属 于 数据 的 向 分 类 范畴 ， 当 我 们 运行 所 有 个 自 变量 的 水 平 的 组 合 时 ,产生 数据 的 向 分 类 . 这 
些 自 变量 可 以 是 因子 或 区 组 . 

例如 , 考虑 一 个 重复 的 2 x3 x3 析 因 试验 , 根据 完全 随机 化 设计 , 将 2 x3 x3 =18 个 处 理 随机 指 
派 到 试验 单位 . 因为 对 三 个 因子 的 每 个 组 合 (总 共 18 个 ) 都 要 检查 , 通常 称 这 种 设计 为 数据 的 3 向 分 
K. 类 似 地 , 如 果 将 (一 1) 个 因子 析 因 试 验 的 处 理 随机 指派 到 随机 化 区 组 设计 的 试验 单位 , 将 得 到 
数据 的 向 分 类 . 例如 , 假如 将 完全 2 x3 析 因 试验 的 2 x3 =6 个 处 理 指派 到 包含 6 个 试验 单位 的 区 
组 , 数据 按 三 向 分 类 排列 ， 即 按照 两 个 因子 和 区 组 分 类 . 

对 数据 的 向 分 类 方差 分 析 , 计算 主 效应 和 交互 作用 平方 和 要 求 的 公式 更 复杂 , 所 以 这 里 就 不 
给 出 , 如 果 对 计算 公式 感 兴趣 , 见 参考 文献 . 如 前 面 三 节 中 给 出 的 设计 一 样 , 我 们 为 这 些 更 复杂 的 设 
计 提 供 适 当 的 线性 模型 ,并 利用 回归 或 统计 软件 包 的 标准 ANOVA 输出 来 分 析 数 据 . 
考虑 定性 因子 的 2 x3 x3 析 因 试验 , 将 + =3 个 试验 单元 随机 指派 给 每 个 处 理 

a. 写 出 此 设计 适当 的 线性 模型 . 

b. 在 部 分 ANOVA 表 中 , 指出 变异 来 源 及 其 关联 的 自由 度 . 
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解 

a. 记 三 个 定性 因子 为 4,8 RI C, 其 中 4 是 两 水 平 的 , BA C 各 是 三 水 平 的 . 那么 试验 的 线性 模 
型 将 包含 一 个 相应 于 主 效 应 4 的 参数 , 2 个 相应 于 每 个 主 效应 B 和 C 有 2 个 参数 , 对 每 个 4B 及 AC 
的 交互 作用 有 (1)(2) 22 个 参数 , 对 BC 交互 作用 有 (2)(2) =4 个 参数 , 对 ABC 三 向 交互 作用 有 
(1) (2) (2) =4 个 参数 . 三 向 交互 作用 项 反映 第 三 个 因子 从 一 个 水 平 到 另 一 个 水 平时 , 两 向 交互 作用 
效应 不 能 保持 相同 . 模型 为 : 

E(y) =Bo + Bixl + B2%2 +B3x3 + Baxa +Bsxs + Bexix2 * Byxixa + Bex1x4 +Box1xs 


—— —————— ————— 
4 主 效 应 BEY C 主 数 应 A x B 交 互 作用 Ax CC 交互 作用 


+ Biox2x4 + Biixaxs +B12%3%4 +B1i3x3xs + Biax1x2%4 + Biszixax4 + Bi6zixə2xs + B17X1X3X5 





B x C 交 互 作用 A x B xC 交 互 作用 
其 中 

1 如 果 是 4 的 水 平 1 | 如 果 是 妃 的 水 平 1 RT 例 14.12 的 方差 分 析 表 

n lo 如 果 是 4 的 水 平 2 7C b 如 果 不 是 来 源 qf 

1 如 果 是 8 的 水 平 2 1 ”如 果 是 C 的 水 平 1 主 效应 4 1 

un lo 如 果 不 是 ^ lo 如 果 不 是 ERUN B 2 

_ 1 如 果 是 C 的 水 平 2 主 效 应 C 2 

s=] maqa 人 交互 作用 ; 

b. 3614.7 中 给 出 了 相应 于 这 些 参数 集 的 变异 来 源 和 各 自 。 hc 交互 作用 2 

的 自由 度 . BC 交互 作用 4 

SS( 总 ) 的 自由 度 总 是 等 于 (n-1) , Bn RS S 的 1 个 自由 ABC 将 作用 ， 

度 . 由 于 所 有 变异 来 源 自由 度 的 和 必须 等 于 SS( 总 ) 的 自由 度 ， py 

误差 的 自由 度 等 于 SS( 总 ) 的 自由 度 减 去 主 效应 和 交互 效应 的 自 总 和 3 


由 度 之 和 , Bl (n -1) -17. 我 们 的 试验 对 2 x3 x3 218 个 处 理 的 
每 一 个 将 包含 三 个 观测 值 ; 由 此 得 出 ”= (18) (3) 254, 因此 , 误差 的 自由 度 等 于 53 - 17 =36. 

如 果 用 计算 机 分 析 试 验 数据 , 计算 机 输出 会 给 出 构造 的 方差 分 析 表 , 它 包 含 关联 的 均 方 , FR 
验 统计 量 的 值 和 它们 观测 的 显著 性 水 平 . 每 个 下 统计 量 表示 来 源 均 方 与 MSE =s? 的 比 . 
晶体 管制 造 商 进行 一 个 试验 , 研究 三 个 因子 对 每 周 40 h 的 生产 率 ( 以 产品 的 千 美元 度 
量 ) 的 影响 .因子 如 下 : 

- 1. 工作 周 时 长 度 ( 两 水 平 ) ; 5 个 连续 的 8h 工作 日 或 4 个 连续 的 104 THH. 

2. 轮班 (两 水 平 ) : 日 班 或 夜班 

3. 休息 次 数 (三 水 平 ) ; 0.1 或 2. 

试验 进行 24 个 星期 的 时 间 , 将 2 x2 x3 =12 个 处 理 随 机 的 指派 给 这 24 个 星期 , 完全 随机 化 设 
计 的 数据 在 表 14.8 中 给 出 . 对 此 数据 进行 方差 分 析 . 

表 14.8 例 14.13 的 数据 











日 班 休息 次 数 夜班 休息 次 数 
. 0 1 2 0 1 2 
工作 周 时 长 度 4 天 94 105 96 90 102 103 


97 106 91 89 97 98 
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(&) 
日 班 休息 次 数 夜班 休息 次 数 
0 1 2 0 1 2 
96 100 82 81 90 94 
周 工作 时 长 度 5 天 
92 103 88 84 92 96 
解 ” 对 数据 进行 方差 分 析 . SAS 输出 在 图 14. 20 中 给 出 . 
The ANOVA Procedure 
Dependent Var iable: PRODUCT 
Sum of 
Source DF Squares Mean Square F Value Pr >F 
(D | model 11 1008.833333 91.803030 13.43 <.0001 
Error 12 82.000000 6.833333 
torrected Total 23 1091.833333 
R-Square Coeff Var Root MSE PRODUCT Mean 
0.924897 2.758647 2.514085 94.41667 
Source DF ñnova 88 Mean Square F Value Pr >F 
SHIFT 1 48.1666667 48.1666667 7.05 0.0210 
DAYS 1 204.1666667 204.1666667 29.88 0.0001 
© |SHIFT*DAYS 1 8.1666667 8. 1666667 1.20 0.2958 
BREAKS 2 334 . 0833333 167.0416667 24.45 <.0001 
SH IFT*BREAKS 2 385.5833333 192.7916667 28.21 <.0001 
BREAKS*DAYS 2 8.0833333 4.0415557 0.59 0.5689 
SHIFT*BREAKS*DAYS 2 21.5833333 10.7916667 1.58 0.2461 

















图 14.20 2 x2 x3 析 因 的 SAS ANOVA 输出 


将 SAS 输出 的 相关 部 分 用 框 格 围 起 来 并 编号 如 上 . 

1. 在 框 格 1 中 的 修正 总 和 (Corrected Total ) 行 给 出 的 SS( 总 ) 的 值 为 1 091. 833333. 与 这 个 量 对 应 的 自 
由 度 等 于 (n -1) = (24 - 1) =23. 框 格 1 给 出 这 个 量 分 解 (方差 分 析 ) 为 两 个 变异 来 源 . 第 一 个 来 ， 
源 古 模型 ( Model) , 相应 于 模型 中 的 11 个 参数 (除了 Bo 的 所 有 参数 ) ， 第 二 个 来 源 是 误差 ( Error). 
这 些 量 的 自由 度 、 平 方 和 及 均 方 分 别 在 各 自 的 列 中 给 出 . 例如 ，MSE = 6. 833333. 检验 

Ho: Bı =B, =…=B =0 

的 玉 统 计量 的 自由 度 为 vi =11 和 vw =12, 在 输出 中 显示 为 =13.43. 在 Pr>F 下 给 出 观测 的 显 
著 性 水 平 小 于 0. 0001 ,这 样 小 的 观测 显著 性 水 平 给 出 充分 证 据 ， 表明 三 个 自 变量 (轮班 、 工 作 周 的 
天 数 或 每 天 休息 次 数 ) 中 至 少 有 一 个 对 平均 生产 率 的 预测 贡献 了 信息 . 

2. 为 了 确定 哪些 参数 集 对 y 的 预测 真正 贡献 了 信息 , 我 们 检查 SS( 模 型 ) 分 解 为 ( 框 格 2) 相 应 于 主 
效应 (轮班 、 天 数 、 休 息 ) 及 两 因子 交互 作用 (轮班 * 天 数 、 轮 班 * 休息 、 天 数 * 休息 ) 的 参数 集合 
的 分 量 , 最 后 的 模型 变异 来 源 相应 于 所 有 三 向 轮班 = 天 数 * 休息 的 参数 集 . 注意 这 些 来 源 的 自由 
度 之 和 等 于 11, 是 模型 的 自由 度 个 数 . 同样 , 各 分 量 平方 和 之 和 等 于 SS( 模 型 ). 框 格 2 没有 给 出 
与 来 源 关 联 的 均 方 2, 但 是 给 出 了 与 每 个 变异 来 源 关 联 的 参数 集 所 涉及 的 假设 检验 的 正 值 , 还 给 





O 实际 上 给 出 了 一 一 译 者 注 . 
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出 了 这 些 检验 的 观测 显著 性 水 平 . 可 以 看 出 有 充分 的 证 据 表明 存在 轮班 * 休息 的 交互 作用 , 在 显 
著 性 水 平 a=0.05 时 , 与 三 个 主 效应 参数 集 关联 的 检验 也 都 是 统计 显著 的 , 这 些 结果 的 实际 仿 
义 是 有 证 据 表明 所 有 三 个 自 变量 (轮班 、 每 周 的 工作 天 数 或 每 天 的 休息 次 数 ) 都 对 生产 率 的 预测 
贡献 了 信息 . 轮班 * 休息 的 交互 作用 存在 意味 着 休息 次 数 对 生产 率 的 影响 因 轮班 而 不 同 , 因此 ， 
在 某 个 当班 时 间 可 能 达到 最 大 生产 率 的 休息 次 数 , 可 能 不 同 于 另 一 个 当班 时 间 达 到 最 大 生产 率 的 
休息 次 数 . 

3. 框 格 3 给 出 了 s= /MSE =2.614065. 这 个 值 将 用 于 构造 12 个 处 理 均值 的 成 对 比较 的 置信 区 间 . 
(过 程 的 细节 将 在 14.8 节 给 出 . ) 

4. 框 格 4 给 出 的 RR 值 是 模型 拟 合 试验 数据 好 坏 的 度量 . 当 误 差 的 自由 度 大 ( 如 至 少 是 5 或 6) 时 , 这 
是 个 重要 的 值 . 误差 自由 度 的 个 数 越 大 , 它 的 实际 重要 性 就 越 大. 这 个 分 析 的 R2 值 为 0.924897， 
表明 模型 对 数据 提供 一 个 相当 好 的 拟 合 . 它 还 间接 表明 可 以 通过 在 包含 原 变量 的 模型 中 添加 新 的 
预测 变量 或 可 能 的 话 , 添加 高 阶 项 来 改进 模型 

在 一 个 生产 过 程 中 , 将 颗粒 状 塑料 加 热 到 熔融 状态 , 然后 在 压力 下 挤 压 它 通 过 一 个 管 嘴 

生产 出 一 种 塑料 杆 . 进行 一 项 试验 调查 挤 压 温度 ( 下) 和 压强 (lb/in? ) 这 两 个 因子 对 模压 棒 挤 压 速度 

(in/s) 的 影响 , 进行 完全 2 x2 析 因 试验 ( 即 每 个 因子 有 两 水 平 ), 有 三 批 颗粒 状 塑料 用 于 这 项 试验 ， 

每 批 ( 看 成 区 组 ) 分 成 4 等 份 , 某 批 的 4 份 颗粒 状 塑料 随机 指派 给 4 种 处 理 , 三 批 都 如 此 重复 ,在 三 

个 区 组 中 得 到 2 x2 析 因 试验 的 安排 . 数据 显示 在 表 14.9 中 ,对 这 些 数据 进行 分 析 . 

表 14.9 例 14.14 的 数据 
批 ( 区 组 ) 








解 试验 由 相应 于 批 (区 组 )、 压 强 和 温度 的 三 向 分 类 数据 组 成 ， 用 随机 化 区 组 设计 ( 三 个 区 组 ) 
安排 2 x 2 析 因 试验 (4 个 处 理 ) 的 方差 分 析 的 来 源 和 自由 度 显示 在 表 14. 10 rh. 
试验 的 线性 模型 是 : 
ESP 主 效应 pT 交互 作用 区 组 项 
一 人 一 


表 14.10 例 14.14 的 来 源 和 自由 度 表 








E(y) =P + Pa + Ex, + Baxixz + 4xa +Bsx4 来 源 df 

其 中 ， 压强 (P) 1 
x, = 压强 ET uL ; 
QJ 如 果 是 区 组 2 _ [1 如 果 是 区 组 3 Fm m mE 

un lo 如 果 不 是 un lo 如 果 不 是 - 6 
方差 分 析 的 SPSS 输出 在 图 14.21 中 给 出 . 整体 模型 的 下 总 和 u 





检验 是 高 度 显著 的 (p 值 =0.000). 因此 , 有 充分 的 证 据 
表明 区 组 均值 或 处 理 均值 或 二 者 之 间 有 差异 . 继续 进行 模型 来 源 的 分 解 ， 可 以 看 出 压强 、 温度 和 温 
BE -压强 交互 作用 的 下 统计 量 的 值 都 是 高 度 显著 的 ( 即 它们 的 观测 显著 性 水 平 都 非常 小 ). 因此 , 所 
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有 的 项 (Bi1x1，, B2% 和 Bax x, ) 都 对 y 的 预测 贡 


贡献 信息 


Tests of Berween-Subjects Effects 


Dependent Variable: RATE 





Corrected Model 
Intercept 
PRESSURE 


7.1493 
58.256 
1.587 

















TEMP 5.044 
PRESSURE * TEMP .361 
BATCH 5.732E-02 











Error 
Total 
Corrected Total 


.103 
65.509 
1.252 


Type III Sum Lx 
Source of Squares Mean Square 













1.430 5 226 
58.256 | 3390.818 
1.687 98.222 

5.044 293.590 
.361 20.985 
2.966E-02 1.568 
1.718E-02 























a. R Squared = .986 (Adjusted R Squared = .974) 


图 14.21 


15| 14. 14 的 SPSS ANOVA 输出 


试验 中 的 处 理 是 根据 随机 化 区 组 设计 指派 的 , 所 以 我 们 期 望 塑料 的 挤 压 随 批 的 变化 而 变化 . 
为 检验 区 组 均值 之 间 差 异 的 FF 检验 不 是 统计 显著 的 (观测 的 显著 性 水 平 Pr >F 大 到 0.265) , 所 以 没 
有 充分 的 证 据 表明 塑料 的 平均 挤 压 随 批 次 不 同 而 有 差异 , 分 组 似乎 并 没有 使 试验 信息 量 增加 . 

许多 其 他 复杂 的 设计 , 如 部 分 析 因 、 拉丁 方 设计 和 不 完全 区 组 设计 , 都 属于 一 般 有 向 分 类 数据 . 
这 些 设计 的 安排 和 适合 分 析 它 们 的 线性 模型 可 以 查询 参考 文献 . 


应 用 练习 

14.32 以 计算 机 为 媒介 的 通信 研究 . 计算 机 媒体 通 
信 (CMC) 是 一 种 包含 大 量 技术 的 相互 联系 形式 (如 
即时 信息 、 电 子 邮 件 等 ), 在 Journal of Computer- 
Mediated Communication ( 2004 4E 4 FH) rh, 研究 比 
较 通 过 CMC 相互 联系 的 人 们 与 面对面 (FTF ) 会 面 
的 人 们 亲密 关系 . 回忆 练习 8. 36 ,参与 者 为 48 个 
未 毕业 的 大 学 生 , 随机 指派 一 半 到 CMC 组 (用 即 
时 信息 软件 聊天 ”的 形式 交流 ) ， 另 一 半分 配 到 
FTF 组 (在 会 议 室 见 面 ). 每 组 受 试 者 随机 指派 为 要 
求 与 本 组 其 他 成 员 交 流 的 高 度 含糊 语言 (HE) 和 低 
度 含 糊 语言 (LE) 的 任务 . 另外 , 研究 者 还 平衡 性 别 ， 
使 得 每 个 组 - 任务 的 组 合 中 男性 (M) 与 女性 (了 ) 的 
人 数 相同 ; 然后 , 这 些 受 试 者 分 为 男 - 男 对 、 男 - 
女 对 、 女 - 女 对 . 因此 , 在 每 个 2( 组 ) x2( 任 务 ) x3 
(性 别 对 ) = 12 个 处 理 中 指派 两 对 受 试 者 , 设计 的 安 
排 在 后 面 给 出 . 对 每 对 受 试 者 , 记录 感 兴趣 的 变 
E -关系 亲密 得 分 (7 分 制 ). 
a. 写 出 适合 2 x2 x 3 析 因 设计 的 完全 模型. 
b. 对 这 个 设计 的 ANOVA 表 给 出 变异 来 源 及 对 应 

的 自由 度 . 


ARE 没有 显著 的 三 向 交互 作用 , 解释 这 
结果 的 实际 意义 . 
d. SEA ERU RUE MAS HAS 
用 , 解释 这 个 结果 的 实际 意义 
e. 研究 者 发 现 性 别 对 主 效应 或 交互 作用 不 显著 ， 
解释 这 个 结果 的 实际 意义 . 


CMC 组 


HE 任务 LE 任务 


/ |N /|\ 


MM FF MF MM FF MF 
FTF 组 


N 


LE 任务 


ZN 


MM FF MF 
练习 14.32 的 设计 安排 


14.33 硫化 铜 原料 的 浮 选 法 . Brazilian. Journal of 
Chemical Engineering( Vol. 22,2005) 发 表 了 一 个 研 


HE 任务 


/| 


MM FF MF 
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究 , 比较 在 硫化 铜 原料 浮 选 流程 中 的 两 种 发 泡 剂 ， 
这 两 种 发 泡 剂 为 : 表面 活性 生物 油 (SABO) 和 松木 
油 (PO). 用 2 x2 x2 x2 的 析 因 设计 研究 4 个 因子 
对 浮 选 精 矿 中 铜 百分率 的 影响 , 这 4 个 因子 为 ; 发 
泡 剂 (SABO 或 PO) 、 发 泡 剂 与 矿石 块 的 比 ( 低 或 
高 )、 采 集 器 与 矿石 块 的 比 ( 低 或 高 ) 及 液体 与 固体 
的 比 ( 低 或 高 ). 对 2 x2 x2 x2 =16 个 处 理 中 的 每 
个 测量 铜 的 百分比 y, 数据 在 表 中 给 出 . 








RUNS ”采集 器 与 WES i 
矿石 块 的 比 PARKE EER HE SABO PO 
L L L 6.11 6. 96 
H L L 6.17 7.31 
L H L 6.60 7.37 
H H L 7.15 7.52 
L L H 6.24 7.17 
H L H 6.98 7.48 
L H H 7.19 7.57 
H H H 7.59 7.78 


资料 来 源 : Brossard, L. E. , et al. “The surface-active bio 
oil solution in sulfured copper mineral benefit. ” Brazilian Jour- 
nal of Chemical Engineering, Vol. 22 , No. 1, 2005(X& 3). 


a. 写 出 一 个 适合 2 x2 x2 x2 析 因 设计 的 完全 模型 . 

. 注意 试验 中 没有 重复 ( 即 16 个 处 理 中 每 个 处 理 
只 有 一 个 观测 值 . ) 这 对 a 中 模型 的 分 析 有 何 
影响 ? 

e. 号 出 一 个 只 包含 主 效应 和 两 向 交互 作用 项 的 

E(y) 模 型 . 

用 c 中 的 模型 拟 合 数据 , 给 出 最 小 二 乘 预测 

方程 . 

e， 对 交互 作用 项 进行 检验 (a =0.05), 解释 结果 . 

f. 进行 主 效应 检验 适当 吗 ? 如果 适 当 ， 进行 这 个 
分 析 , 如 果 不 , 解释 为 什么 ? 

14.34 铜板 纸 的 白 度 . 进行 一 个 试验 以 研究 三 个 因 

子 (造纸 原料 、 漂 白 混 合 物 及 涂 层 类 型 ) 对 优质 铀 

板 纸 白 度 的 影响 . 三 种 造纸 原料 (因子 A) , 4 种 漂 


c 


R- 


白 剂 (因子 8) ,两 种 涂 层 ( 因 子 C) 用 于 试验 . 对 
3 x4 x2 原 料 -漂白 剂 - 涂 层 组 合 中 的 每 一 个 制备 
6 张 纸张 样品 , 并 记录 测 得 的 白 度 . 

a. 建 一 个 方差 分 析 表 , 给 出 变异 来 源 及 各 自 的 自 
由 度 . 

b. 假定 MSE =0.14, MS(AB) -0.39, 且 所 有 组 合 
的 交互 作用 的 均 方 为 0.73. 这 些 数据 是 否 有 充 
分 的 证 据 表 明 三 个 因子 间 有 交互 作用 ? 用 a = 
0.05 检验 . 

c. 这 些 数据 是 否 给 出 充分 的 证 据 表明 4B 有 交互 
作用 ? 用 a 20.05 检验 . 从 实际 观点 ,4B 交互 
作用 的 意义 是 什么 ? 

d. 假定 SS(4) =2.35, SS(B) =2.71, SS( C) = 
0.72. 求 SS( 总 ) , 然后 求 R, 并 解释 这 个 值 . 


14.35 高 强度 镍 合金. 随 着 逐渐 恶化 的 油井 环境 ， 


石油 生产 商 对 抵抗 腐蚀 的 高 强度 镍 合金 感 兴 趣 . 因 

为 镍 合金 对 氢 脆 性 特别 敏感 ,所 以 进行 一 项 试验 

比较 在 氮 重 组 毒物 ,二硫化碳 饱 和 的 4% 硫酸 溶液 

中 , 阴 板 充电 的 镍 合金 拉 伸 样品 的 强度 . 两 种 合金 

为 : 英 康 乃 尔 合金 (75% 镍 成 分 ) 、 英 康 洛 依 合金 

(30% RRI). 合金 在 两 种 原料 ( 冷 轧 和 冷 拉 ) 条 

件 下 检验 , 每 种 有 三 个 不 同 的 充电 时 间 (0,25,50 

A). 因此 进行 两 水 平 的 合金 类 型 ,两 水 平 的 原料 

条 件 , 三 水 平 充 电 时 间 的 2 x 2 x 3 析 因 试验 . 对 

2 x2 x3 =12 个 因子 水 平 组 合 中 的 每 一 个 , 制备 两 

个 电解 渗 迄 拉 伸 样品 , 它们 的 强度 (kg/in? ) 记录 在 

下 面 的 表 中 . 

a. 下 面 给 出 了 数据 方差 分 析 的 SAS 输出 , 存在 三 
个 因子 间 交 互 作用 的 证 据 吗 ? 用 a =0.05 检验 . 
(2: 这 意味 着 必须 检验 所 有 交互 作用 参数 . 从 
SSE 减 去 对 此 检验 适当 的 量 应 当 是 所 有 交互 平 
方 和 的 和 . ) 

b. 现在 检查 输出 中 给 出 的 对 单个 交互 作用 的 下 检 
验 . 在 0.05 的 显著 性 水 平 下 ,， 哪 一 个 交互 作用 
是 统计 显著 的 , 如 果 有 的 话 ? 


合金 类 型 








充电 时 间 
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Dependent Variable: 


Source 


YIELD 


The ANG 


Model 11 1931 
Error 12 8 
Corrected Total 23 1939 
R-Square Coeff Var 
0.995801 1.801942 
Source DF n 
ALLOY 1 552 
MATCOND 1 956 
ALLOY*MATCOND 1 339 
TIME 2 71 
fiLLOY* TIME 2 7 
MATCOND* T IME 2 4 
fALLOY*MATCOND* T I ME 2 0. 
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VA Procedure 
Sum of 

Squares Mean Square F Value Pr f 
. 734583 175.612235 258.73 <.0001 
. 145000 0.678750 
.879583 

Hoot MSE YIELD Mean 

0.823863 45.72083 
nova SS Mean Square F Value Pr »F 
.0004157 552.0004167 813.26 <.0001 
-3437500 956 . 3437500 1408.98 <.0001 
. 7537500 339.7537500 500.56 <.0001 
. 0408333 35.5204167 52.33 <.0001 
. 9858333 3.9929167 5.88 0.0166 
. 1725000 2.0862500 3.07 0.0836 
4375000 0.2187500 0.32 0.7306 





练习 14.35 的 SAS 输出 结果 


14.36 高 强度 镍 合金 ( 续 ). 参考 练习 14.35. 因为 充 
电 时 间 是 定量 因子 , 所 以 我 们 可 以 对 合金 类 型 与 原 
料 条 件 的 4 个 组 合 中 的 每 一 个 绘制 强度 y 关于 充电 
时 间 x, 的 图 . 这 启发 将 平均 强度 y 与 充电 时 间 x, 联 
系 起 来 的 预测 方程 可 能 是 有 意义 的 . 考虑 模型 
E(y) 2B, *Bix, * Box, +B,x, +B,xs t Bsxx, + fux x, 


2 2 
* By t By ox, +Boxixy Bx xs +B 


其 中 : 
Xi = 充电 时 间 


” “10 如 果 是 英 康 洛 依 合 多 


«| 


1 如 果 是 冷 轧 
0 如果 是 冷 拉 


a. 用 上 面 的 模型 ,对 冷 拉 英 康 洛 依 合 金 , 给 出 平 
均 强 度 E(y) 与 充电 时 间 x, 间 的 关系 . 

b. 用 上 面 的 模型 ,对 冷 拉 英 康 乃尔 合金 , 给 出 平 
均 强 度 E(y) 与 充电 时 间 x, 间 的 关系 . 

e. 用 上 面 的 模型 , 对 冷 轧 英 康 乃尔 合金 , 给 出 平 
均 强 度 y 与 充电 时 间 x, 间 的 关系 . 

. 用 模型 拟 合 数 据 , 并 求 预测 方程 . 

. 参考 d, 求 合金 类 型 与 原料 条 件 的 4 个 组 合 中 每 
个 的 预测 方程 . 

f. 参考 d, 对 合金 类 型 与 原料 条 件 4 个 组 合 中 的 每 
一 个 , 绘制 数据 点 图 , 画 出 各 自 的 预测 方程 . 


g. 


o° 








Analysis of Variance for YIELD, 


Source 
PRESSURE 

TEMP 
PRESSURE*TEMP 
WEEK 

Error 

Total 


S = 1.30171 


DF Seq SS Adj 
1 208.33 208. 
1 363.00 363 
1 27.00 27 
2 15.13 15. 
6 ZU SL? 10. 
11 623.67 
R-Sq = 98.375 


using Adjusted SS for Tests 
SS Adj MS F P 

33 208.33 122.95 0.000 
.00 363.00 214.23 0.000 
.00 27.00 15.93 0.007 

17 7.58 4,48. (3.055 

17 1.69 
R-Sqí(adj) = 97.015 








练习 14.38 的 MINITAB 输出 


14.37 高 强度 镍 合金 ( 续 ). 参考 练习 14. 35 和 
14.36. 如 果 平 均 强 度 E( y) 与 充电 时 间 x, 之 间 的 关 
系 对 所 有 合金 类 型 和 原料 条 件 的 4 个 组 合 是 相同 
的 , 则 有 (y) 的 恰当 模型 为 : 

E(y) 2 * Bix, * Box, 


用 这 个 模型 拟 合 数据 . 利用 回归 的 结果 及 练习 
14.36 输 出 的 信息 一 起 决定 数据 是 否 提供 充分 的 证 
据 表明 对 合金 类 型 和 原料 条 件 的 4 个 类 型 , 联系 
E(y) Ej x, 的 二 阶 模型 是 不 同 的 . 用 a =0.05 检验 . 
14.38 调查 化 学 药品 的 产量 . 每 周 进行 一 个 2 x2 因 
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.这 个 试验 所 用 的 设计 类 型 是 什么 ? 
.构造 方差 分 析 表 ,给 出 所 有 来 源 及 各 自 的 自 


子 试验 , 共 试 验 三 周 以 确定 两 个 因子 : 温度 和 压强 
对 化 学 药品 产量 的 影响 . 温度 设置 为 300Y 和 


= e 


500. 化 学 反应 中 维持 的 压强 设置 100 和 200 Ib/ 由 度 . 

ii^. 在 每 周 中 随机 选择 4 天 , 将 它们 随机 指派 给 4 c. 为 什么 方差 分 析 中 不 包含 周 与 温度 和 压强 的 交 
个 因子 -水 平 组 合 , 安排 在 三 个 时 间 区 组 的 2 x2 互 作用 来 源 ? 

析 因 试验 产生 的 数据 在 下 表 中 给 出 , 方差 分 析 的 d. 数据 是 否 提供 充分 的 证 据 表明 温度 和 压强 之 间 
MINITAB 输出 如 上 所 示 . 有 交互 作用 ? 给 出 检验 的 p 值 , 这 个 结果 的 实 
— — —RBiWmE E2:HHE ”第 3 局 汤 度 际 意义 是 什么 ? 





.对 时 间 分 区 是 否 增加 了 试验 信息 ? 即 数 据 是 否 
提供 了 充分 的 证 据 表 明 区 组 均值 之 间 有 差异 ? 
给 出 检验 的 p 值 . 


e 


300 500 300 à 500 300 500 


压强 100 64 73 65 72 62 70 
200 69 81 71 85 67 83 





"14.7 套 式 抽样 设计 


ANOVA 模型 中 的 随机 误差 试图 表示 影响 响应 变量 y 的 许多 变量 (它们 中 的 大 多 数 是 未 知 的 ) 
的 贡献 . 我 们 希望 这 些 变量 对 响应 的 净 效 应 表现 出 11.2 节 所 列 假定 中 描述 的 性 质 , 有 时 候 进入 误差 
平方 和 的 变异 来 源 可 以 分 解 成 两 个 或 更 多 来 源 . 下 面 举例 说 明 这 种 情况 . 

假定 一 药剂 制造 商 想 要 估计 一 批 抗 生 素 的 平均 效力 . 由 于 至 少 两 个 随机 误差 来 源 的 影响 , 由 一 
台 设 备 产 生 的 效力 读数 将 随 观 测 的 变化 而 改变 , 在 一 大 桶 中 生产 的 抗生素 并 非 均匀 的 物质 ; 因 一 批 
中 不 同位 置 , 效力 略 有 变化 . 另外 , 由 于 设备 误差 在 测量 过 程 中 产生 的 效力 读数 随 观测 的 变化 而 改 
变 . 因此 , 对 相同 的 样品 重复 测量 会 得 到 不 同 的 读数 . 

分 解 和 估计 这 两 个 变异 来 源 量 值 的 一 个 方法 是 进行 两 阶 抽 样 . 首先 ,从 批 中 随机 选择 n, 个 样 
品 . 然后 对 每 个 样品 的 效力 测量 n, IK. 因为 n, 个 第 二 段 阶 抽样 单位 是 由 每 个 第 一 阶 抽样 单位 或 初级 
单位 得 到 的 ( 见 图 14.22) ,抽样 过 程 称 为 套 式 抽样 设计 , 也 叫做 再 抽样 , 即 在 一 个 样本 中 抽样 . 


1 2 ni 
第 一 阶 单位 m 
第 二 阶 单位 ... ee ... 


图 14.22 二 阶 套 式 抽样 设计 的 图 示 


定义 14.3 ”二 阶 套 式 抽样 设计 包含 从 总 体 中 随机 选择 ml 个 一 阶 抽 样 ( 初 级 ) 单 位 ， 再 从 每 个 初 
级 单位 中 随机 选择 m 个 二 阶 单位 的 子 样本 . 

套 式 抽样 可 以 推广 到 任何 阶 . 例如 , 假定 设备 对 样品 的 效力 有 影响 之 后 , 在 取得 单个 读数 之 前 ， 
操作 者 都 必须 重新 设置 测量 仪器 . 因此 , 由 于 操作 者 重新 校准 程序 , 设备 对 一 个 样品 重复 的 影响 将 
随 观 测 的 不 同 而 变化 , 第 三 个 抽样 误差 来 源 的 量 值 将 用 三 阶 抽样 设计 来 评估 . 除了 先前 描述 的 二 阶 
抽样 设计 , 由 设备 对 样品 的 反应 产生 的 每 次 测量 , 操作 者 都 需要 重新 校准 并 读 出 计量 器 n, 次 . 三 阶 
套 式 抽 样 试验 在 图 14.23 HER. 
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第 一 阶 单位 


第 二 阶 单位 


第 三 阶 单位 





图 14.23 三 阶 套 式 抽样 设计 的 图 示 


在 前 节 给 出 ANOVA 设计 的 概率 模型 称 为 固定 效应 模型 ,因为 除了 随机 项 , 模型 中 所 有 分 量 ( 例 
如 处 理 、 因子 交互 作用 ) 的 水 平 在 观测 响应 y 之 前 都 是 设 定 或 固定 的 ” 相反 地 , 套 式 抽样 设计 模型 
包含 多 于 一 个 随机 分 量 ; 因此 , 称 它们 为 套 式 模型 . 对 套 式 设计 模型 和 相应 的 ANOVA 在 本 节 中 
给 出 . 
二 阶 套 式 抽样 设计 

考虑 一 个 二 阶 套 式 抽样 设计 , 其 中 n, 个 一 阶 单位 中 的 每 个 有 n, 个 二 阶 单位 . 因为 每 个 二 阶 单 
位 产生 一 个 观测 值 , 试验 得 到 n - nn, 个 响应 变量 y 的 值 . 

我 们 令 表示 第 i 个 (i=1,2,…, n) Bini, 第 7 个 (=1, 2,…， ny) 二 阶 单位 的 观测 值 ， 
将 在 下 面 框 格 中 给 出 用 于 描述 这 个 响应 的 概率 模型 从 实际 的 观点 , 这 个 模型 意味 着 y 等 于 一 个 党 
Zr u 加 上 两 个 随机 分 量 a, 和 £i. 相同 的 第 一 阶 度量 单位 ; 中 的 每 个 二 阶 单位 的 响应 , 由 于 受 相同 随 
机 量 o, 的 影响 ,读数 会 高 于 或 低 于 ，， 每 个 二 阶 单位 中 的 响应 yy 也 会 比 (+a) 大 于 或 小 于 某 个 量 
5j， 这 个 随机 误差 随 二 阶 单位 不 同 而 变化 。 

因为 yy 等 于 常数 风 加 上 两 个 正 态 分 布 的 随机 变量 的 和 , 因此 yy 是 正 态 分 布 随机 变量 , 均值 和 方 
3. 

E(y;) =u * E(oj) +E(ey) xu +0+0=u 


V(y;) = V(aj) +V(e;) *2Cov(e5,o;) 202 +0? +0=o2 +0? 





二 阶 套 式 抽样 设计 的 概率 模型 
y; =u ta, +e; (i21,2,-,n,; Jz1,2,-,n,) 
其 中 o 和 gy 是 独立 的 正 态 分 布 随机 变量 ,满足 
E(o;) =E(s,) =0 
V(a;) =o 
We) =o 
35b, 每 对 a, fi o (ij) 的 值 都 是 独立 的 ; 类 似 地 ， 每 对 s 值 也 是 独立 的 . 




















注意 到 尽管 模型 中 所 有 随机 分 量 都 是 相互 独立 的 ， 但 在 相同 的 一 阶 单位 中 的 7 值 是 相关 的 . 为 
说 明 这 一 点 , 第 i 个 一 阶 单位 中 的 两 个 观测 之 间 的 相关 性 为 . 
Cov(yj, ya) =E|[y;-E(y;)][ya -Elya)]} = E[ (ute; teg-u)(u ta; *eg -u)] 


=E[ (a; +e;)(e; +e)] = E(a2 *tajej taijéi, *tegeg) 
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-E(o2) * E(ojej) +E(a;ga) +E(8;8y) 
最 后 三 项 的 期 望 (这 也 是 协 方 差 ) 等 于 0, 因为 假定 模型 中 随机 分 量 是 独立 的 . 那么 , 由 于 Ela) =0， 
VAE) 2o ,在 相同 的 一 阶 单位 中 两 个 y 值 之 间 的 协 方差 是 : 
Cov(y;;, Yip) =o, 
套 式 抽样 设计 的 方差 分 析 将 SS C.) 分 解 为 两 部 分 ( 见 表 14.11) :一 个 是 度量 一 阶 均值 间 的 变异 
FE, 一 个 度量 单个 一 阶 单位 内 yy 值 的 变异 性 . 
表 14.11 两 阶 套 式 抽样 设计 的 方差 分 析 表 








来 源 df SS MS E(MS) F 
第 一 阶 : A n, -1 SS(A) MS(A) o? «n;o MS(A)/MS(A 中 的 B) 
第 二 阶 : 4 中 的 B n((m,-1) SS(4 中 的 8B) ”MS(4 中 的 B) o? 
总 和 nm -1 SS( 总 ) 


方差 分 析 的 目的 是 得 到 o2 和 o? 的 估计 , 并 确定 是 否 02, >0， 即 一 阶 (4) 单 位 中 的 变异 性 是 否 
超过 了 一 阶 单位 内 y 值 的 变异 性 . MS(4) 和 MSCA 中 的 8B) 的 期 望 值 在 表 14. 11 的 E(MS) 列 中 给 出 . 
o? 和 o? 的 无 偏 估计 可 由 这 些 均 方 得 到 . 另外 , 还 可 以 证 明 ( 证 明 省 略 ) 当 02 =0 时 ， 

.... MS(A) 

- MS(A 中 的 B) 

是 自由 度 为 v1 =n, -lz =n (n, -1) 的 正统 计量 . 用 与 前 几 节 中 的 下 检验 相同 的 方法 检验 Ho: cx =0 
对 H,: o? >0. 

二 阶 套 式 抽样 设计 的 方差 分 析 记 号 、 计 算 均 方 的 公式 和 下 检 验 在 下 面 框 格 中 给 出 . 当 你 检查 计 
算 平 方 和 公式 时 , 注意 它们 与 重复 的 两 因子 析 因 试验 的 方差 分 析 对 应 的 公式 相似 . 如 果 将 第 一 阶 单 
位 看 作 分 类 方向 , 那么 这 个 方向 的 主 效应 平方 和 为 SS(4), SS(4 中 的 B8) 可 由 SS(4 中 的 B) = 
SS( 总 ) -SS(4) 计 算得 到 . 


F 








两 阶 套 式 抽样 设计 的 方差 分 析 记 号 
y; = 在 第 i 个 一 阶 单位 中 的 第 j 个 二 阶 单位 的 观测 值 
n, = 第 一 阶 单位 数 
n, = 第 二 阶 单位 数 


n =n n, = 观测 值 的 总 个 数 
A, = 第 ;个 一 阶 单位 中 所 有 观测 值 的 总 和 
A, = 第 i 个 一 阶 单位 元 中 ns 个 观测 值 的 均值 


n? 


Y Y. FOE n 个 观测 值 的 总 和 
了 = 所 有 n 个 现 测 值 的 平均 











两 阶 套 式 抽 样 设计 方差 分 析 的 三 检验 
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| -.. MS(4) _ 
检验 统计 量 : F=MS(A H B) 


拒绝 域 : F>F,, 其 中 F, 是 自由 度 为 mi =n -1, vs =n (n, -1) 的 正统 计量 的 制 表 什 

















尽管 这 些 公式 容易 使 用 , 计算 却 相当 繁杂 . 因此 , 在 例子 中 使 用 统计 软件 包 执行 计算 . 





两 阶 套 式 抽样 设计 的 计算 公式 


、 ( ` ` Y)? 
24 _《 所 有 观测 值 的 总 和 )? £st 
CM = 均值 的 修正 = = 


n 





SCH = È Y Oy - D' = (所 有 观测 值 的 平方 和 ) - CM = Y Y-M 


nj — nj A 
SS(A) = n, > (A, - y)? = > n CM 
SS(A 中 的 B) -SS( &) -SS(A) 
MS(4) -S 


MS(A 中 的 B) = PIE 











DEEG uissscourioh dae skim EH gani. 混合 过 程 的 透彻 性 等 等 
仿 管 假定 这 些 变 量 的 取 值 固定 为 产生 最 大 抗 压强 度 的 值 , 但 他 们 随 着 批 次 略 有 不 同 ， 混 凝 上 的 搞 
压强 度 也 相应 变化 . 州 高 速 公路 部 门 进行 一 个 试验 比较 批 次 间 强 度 的 变异 性 与 同 批 次 制备 的 混 北 
土 样品 的 强度 变异 性 . 在 6 个 批 次 中 , 每 批 次 制备 5 个 混凝土 样品 . 测量 的 抗 压强 度 (klb/in? ) 在 
表 14. 12 中 给 出 . 对 数据 进行 方差 分 析 , 检验 HS: oa =0 对 HH:02 20, 即 批 次 间 的 变异 性 是 否 超 
过 批 次 内 的 变异 性 . 


R14.12 例 14.15 中 混凝土 的 抗 压 强度 测量 值 








批 
1 2 3 4 5 6 
5.01 4.74 4.99 5.64 5.07 5.90 
4.61 4.41 4.55 5.02 4.93 5.27 
5.22 4. 98 4. 87 4. 89 4.81 5. 65 
4. 93 4. 26 4.19 5.51 5.19 4. 96 
5.37 4. 80 4.77 5.17 5.48 5.39 





584 第 14 章 





解 套 式 设计 方差 分 析 的 SAS 输出 在 图 14.24 中 给 出 , SS( 总 ) 分 解 的 ANOVA 汇总 表 在 输出 中 
FERR. 





Nested Random Effects ñnalysis of Variance for Variable STRENGTH 

Var iance Sum of Error Var i ance Perceni 
Source DF Squares F Value Pr >F Term Mean Square Component of Tota 
Total 29 4.745987 0.163655 0.174665 100.0001 
BATCH 5 2.469747 5.21 0.0022 Error 0.493949 0.079821 45.699; 
Error 24 2.276240 0.094843 0.094843 54.300: 

STRENGTH Mean 5.01933333 

Standard Error of STRENGTH Mean 0.12831593 











图 14.24 4814.15 的 套 式 ANOVA 的 SAS 输出 


着 重 显示 的 表 给 出 SS( 总 ) 分 解 成 为 两 个 变异 来 源 : 批 和 误差. 相应 于 误差 部 分 总 是 与 套 式 抽样 
设计 最 后 阶段 单位 中 的 变异 性 关联 的 . 因此 , 对 一 个 二 阶 设计 ， 误差 相应 于 在 批 (4) 中 的 样品 (B). 
因为 批 的 下 值 表示 检验 Ho: oz =0 W Fi. 现在 对 a =0.05, 自由 度 =5， v; =24( 在 表 B. 10 给 出 ) 
的 F, 制 表 为 Fo.os =2. 62. 因为 计算 的 下 值 超过 了 这 个 值 , 所 以 有 证 据 表明 Hs: oa >0 为 真 , 即 批 间 
的 变异 性 超过 了 批 内 的 变异 性 . 注意 观察 的 检验 p 值 (输出 的 阴影 部 分 ) 为 0. 0022, 由 此 得 到 相同 的 
结论 . 

三 阶 套 式 抽样 设计 

现在 假定 有 一 个 三 阶 抽样 设计 , 包含 个 一 阶 单位 , 每 个 一 阶 单位 中 有 n, 个 二 阶 单位 , 每 个 二 
阶 单位 中 有 n 个 三 阶 单位 . 这 个 试验 观测 值 的 总 数 是 n = nnn. 三 阶 套 式 抽样 设计 得 到 的 响应 的 
概率 模型 包含 三 个 随机 效应 , 分 别 表示 一 阶 、 二 阶 、 三 阶 抽样 单位 间 的 变异 性 . 我 们 用 yj 表示 在 第 i 
个 一 阶 单位 内 , 第 j 个 二 阶 单位 中 的 第 个 三 阶 单位 的 响应 ， 7 洲 的 模型 在 下 面 给 出 . | 








三 阶 套 式 抽样 设计 的 概率 模型 
Ya SU EA; +Y; + £ j, 
其 中 ai， y fa gj 是 独立 的 正 态 分 布 随机 变量 , 满足 
E(a,) =E(y;) =E(e) =0 


V(a;) =o 
V(y;) =o 
Vleg) =o 








另外 ,每 对 oa, 和 o (ij) OE RE E M EO, Sot y oe d EE 





三 阶 套 式 抽样 设计 的 方差 分 析 是 二 阶 分 析 的 推广 . 在 给 出 计算 公式 之 前 ， 检查 表 14. 13 所 示 的 
方差 分 析 表 . 

当 给 出 关于 os 和 o2, 的 假定 时 , 均 方 比 是 自由 度 为 w 和 v; (分 别 相应 于 分 子 和 分 母 均 方 ) 的 下 
统计 量 , 例如 ,如果 o; =0, 那么 E[ MS(4 中 的 B)] - EL MSCB 中 的 C)]B 


y MS(A 中 的 B) 
 MS(B 中 的 C) 
服从 自由 度 为 =n (n; 21) ,vy 2 nin; (ns - 1) B F 4f. 用 这 个 统计 量 检验 Ho: o? =0 对 村:o2 >0. 
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414.13 三 阶 套 式 抽样 设计 的 方差 分 析 表 








来 源 df ss MS E( MS) F 
第 一 阶段 (4) n -1 SS(4) SU ro us EE EY 
第 二 阶段 (4 中 的 B) ni (n; -1) SS(A 中 的 8) Sobe P tmo? MS(A Rés B) 
第 三 阶段 (8 中 的 C) nin (n -1) SS( B 中 的 C) SE EEO E 

总 和 ninn -] SS( 总 ) 


类 似 地 , 如 果 02, =0, IA EL[MS(A)]=E[MS(A FKY B) ], H 
F- MS(A) 
MS(A 中 的 B) 
A ABEN n 2n, -1, v; =n (n, - 1) B F 4l. 这 个 统计 量 用 于 检验 Ho: o? =0 对 Ho? »0. 
用 于 三 阶 套 式 抽样 设计 的 方差 分 析 的 记号 , 计算 公式 及 检验 统计 量 在 下 面 的 框 格 中 给 出 . 





三 阶 套 式 抽样 设计 方差 分 析 的 记号 
ya = 在 第 i 个 一 阶 单位 中 的 第 j 个 二 阶 单位 的 第 个 三 阶 单位 中 的 观测 值 
n, = 第 一 阶 单位 个 数 
n, = 第 二 阶 单位 个 数 
ma = 第 三 阶 单位 个 数 


n 2 n njn, = 观测 值 的 总 个 数 

A, = 第 ;个 一 阶 单位 中 所 有 观测 值 的 总 和 

= 第 ;个 一 阶 单位 所 有 观测 值 的 均 人 

;个 一 阶 单元 中 的 第 个 二 阶 单位 的 所 有 观测 值 的 总 和 
i 个 一 阶 单位 中 的 第 j 个 二 阶 单位 的 所 有 观测 什 的 均值 





L 
B; 
B, 


Is + $ 


ya = 所 有 nn 个 观测 值 的 总 和 


Y= 所 有 个 观测 值 的 均值 








三 阶 套 式 抽样 设计 方差 分 析 的 F 检 验 
第 一 阶 变异 性 的 检验 


Hy: o, =0 
H.: o >0 
检验 统计 量 : F-MS(A 中 的 B) 


拒绝 域 : F»F,, 其 中 F, EH H mx p,-n -1, V, =n, (n, -1) 不 统计 量 的 制 表 值 . 
第 二 阶 变 异性 的 检验 
H;: o =0 
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H,:o? >0 


eag. 万 -MS(4 中 的 B) 
检验 统计 量 : F = MSC F C) 


拒绝 域 : F> F,, 其 中 F, EB BIS v, =ni (n, -1), v; 2nynj(n4 一 1) 的 下 统计 量 的 制 表 值 . 








三 阶 套 式 抽样 设计 的 计算 公式 


m m n 
2 è 2 ( > > ` Ya) 
- (所 有 观测 值 的 总 和 )  — mi f 6| 
CM = 均值 的 修正 = = - 


n 





* 
" 
<. 
" 
| 
" 





SUD = mm Y -D'- D a 
SS(A 中 的 B)= n, Y, -A +n, È (B; -4Y +" +m È Bu -A,» - > > ^ 
注 : 每 当 总 和 平方 并 相 加 时 ,除数 等 于 单个 和 中 观测 值 的 个 数 . 所 以 , 在 第 二 阶段 的 总 和 中 有 ns 个 观 
ME, 在 第 一 阶段 的 总 和 中 有 nn, 个 观测 值 , 
SS(B 中 的 C) =SS( 总 ) -SS(4) -SS(4 iF W B) 
SS(A) 
1 -1 





MS(A) = 一 一 一 


n 


SS(A 中 的 B) SUCRE) 


MS(B 中 的 C) .SS(B 中 的 C) 


mn (m -1) 











CESO 计算 机 科学 家 的 一 项 工作 是 评估 计算 机 硬件 和 软件 系统 ,软件 的 计算 机 性 能 评价 包括 
监测 处 理 任务 的 CPU 时 间 . 除了 任务 间 的 变异 ,CPU 时 间 的 变化 还 依赖 于 递交 任务 的 日 期 、 运行 任 
务 的 起 始 器 (开始 处 理 任务 的 硬件 设备 ). 进行 三 阶 套 式 抽样 试验 比较 三 个 变异 来 源 , 在 随机 选择 的 
5 天 中 , 随机 地 选择 两 个 起 始 器 进行 监测 ， 从 每 个 起 始 器 中 选择 某 种 类 型 的 4 个 任务 . 表 14. 14 给 出 
CPU 时 间 (s), 对 数据 进行 方差 分 析 , 并 检验 下 面 的 假设 ; 

表 14.14 例 14.16 的 CPU 时间 














日 期 
1 2 3 4 5 
起 始 器 1 5.61 1.22 0.89 3.69 7.61 
3.44 1. 86 1.26 10. 84 6.02 
0. 66 0. 05 1. 43 1.07 0.52 
0. 29 2.11 1.90 2. 46 1.98 
2 8.17 1.53 6.27 15.20 2.41 
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日 期 
1 2 3 4 5 


起 始 器 4. 22 3.67 2.55 10. 22 1.77 
2.50 2. 29 1.52 1. 83 1.38 








a. Ho: o =0 X} Hy o? >0( 即 日 期 之 间 的 变异 是 否 超过 日 期 内 的 起 始 器 变异 ). 

b. Hy: o; =0 X} H,: o? >0( 即 日 期 内 起 始 器 的 变异 是 否 超过 起 始 器 内 任务 的 变异 )， 

解 三 阶 套 式 设 计 方 差分 析 的 SAS 输出 在 图 14.25 中 给 出 . 这 个 输出 与 二 阶 套 式 设计 类 似 . 输出 中 
着 重 显示 的 ANOVA 汇总 表 给 出 了 SS( 总 ) 分 解 为 日 期 、 起 始 器 和 误差 的 变异 来 源 . 对 这 个 三 阶 套 式 设 
计 , 日 期 (DAY) 表 示 第 一 阶 变异 来 源 , 日 期 (4) ; 起 始 器 (INIT) 表示 第 二 阶 变 异 来 源 ,日 期 (4) 中 的 起 始 
ACB); 误差 (Error) 对 应 于 在 起 始 器 (8) 中 的 任务 (C), 最 后 阶段 的 来 源 . 注意 用 于 计算 严 统 计量 的 误 
差 项 在 误差 项 中 给 出 . 








Nested Random Effects fnalysis of Variance for Variable CPU 

Variance Sum of Error Var iance Percent 
Source DF Squares F Value Pr >F Term Mean Square Component of Total 
Total 39 414.277438 10.622498 11.485132 100.0000 
DAY 4 95,275425 3.27 0.1131 INIT 23.818856 2.066375 17.9917 
INIT 5 36.439288 0.77 0.5763 Error 7.287858 -0.532725 0.0000 
Error 30 282.562725 9.418758 9.418758 82.0083 

CPU Mean 3.23125000 

Standard Error of CPU Mean 0.77156794 








图 14.25 例 14.16 套 式 ANOVA 的 SAS 输出 


a. 检验 名 :ga =0 Xt H,: 2 20 BJ FIEX F =3.27, 对 应 p 值 是 0.1131. 因为 p 值 超过 w =0.05, 
表示 ot >0 的 证 据 不 充分 ; 即 不 能 推断 日 期 间 的 变异 超过 了 在 日 期 中 起 始 器 的 变异 . 
b. 检验 有 :oy =0 对 及 :cy >0 B F (87 F —0.77, 对 应 的 p (8:850. 5763. 因为 p 值 超过 a =0.05, 表示 
cy >0 的 证 据 不 充分 ; 我 们 不 能 推断 日 期 中 起 始 器 间 的 变异 超过 了 在 起 始 器 中 任务 的 变异 . 
更 复杂 的 套 式 抽样 设计 ( 如 涉及 析 因 试验 和 交互 作用 效应 的 设计 ) 已 超出 了 本 书 的 范围 ,关于 这 
些 复杂 但 有 用 的 设计 的 更 多 信息 可 以 查看 参考 文献 . 


O) 应 用 练习 d. 写 出 这 个 抽样 设计 的 概率 模型 . 
14.39 黑 黏土 和 泥岩 的 密度 .澳大利亚 昆士兰 露天 。 “在 输出 中 找到 os 和 or 信 — 
矿井 的 大 高 墙 倒塌 是 由 高 墙 底 基 附近 称 为 黑 犁 土 f 进行 检验 确定 位 置 间 的 黑 黏 士 和 泥岩 样品 的 密度 








面 的 松软 的 黑 黏土 层 滑动 引起 的 . 进行 一 项 研究 确 DEAT JARRET pyri, Bac -0. 0 fige 
定 黑 黏土 层 的 化 学 及 矿物 学 性 质 是 否 与 泥岩 相似 位 置 1 位 置 2 位 置 3 
(Engineering Geology, 1985 年 10 月 ), 在 井 矿 的 坡 2.06 2. 09 2.07 

道 地 区 粉 砂岩 工作 面 上 随机 选择 三 个 位 置 ， 从 每 s S bs 

个 位 置 中 随机 选择 黑 黏土 和 泥岩 样品 ,样品 的 密度 de i 
(kg/m?) E SERE HER, 套 式 ANOVA 的 SAS 输出 P BO ape 

如 下 页 所 示 . s 资料 来 源 : Seedsman, R. W. , and Emerson, W. W. “The for- 
a. 样本 中 包含 多 少 个 第 一 阶 观 测 值 ? mation of planes of weakness in the highwall at Goonyella Mine 
b. 从 每 个 第 一 阶 单位 中 选择 多 少 个 第 二 阶 单位 ? Queensland, Australia. ” Engineering Geology, Vol. 22, No. 2. 


c. 给 出 样本 中 所 有 观测 值 的 总 数 . 1985 年 10 月 , p.164( 表 1). 
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[ Hested Random Effects finalysis of Variance for Variable DENSITY 
Var (ance Sun of Error Variance Percent 
Source DF Squares F Value Pr »F Term Hean Square Conponent of Total 
Total 14 0.672173 0.048012 9.055800 100.0000 
SITE 2 0.002573 0.02 0.9772 Error 0.001287 -0.010903 0.0000 
Error 12 0.669600 0.055800 9.055800 100.0000 
DENSITY Mean 2.11466667 
l Standard Error of DENSITY Mean 0.00925163 





练习 14.39 的 SAS 输出 


14.40 纸张 的 孔 积 率 . 用 二 阶 套 式 抽样 设计 收集 数 某 个 矿 生产 的 煤 中 硫 含量 的 平均 水 平 . 随机 选择 S 
据 以 估计 造纸 机 生产 的 纸张 的 平均 孔 积 率 . 从 纸 卷 天 作为 煤 抽样 日 , 在 每 一 天 中 , 随机 地 选择 5 个 运 
的 末尾 随机 选择 10 KEH, 在 每 张 纸 片 读 取 4 个 BUE, 并 从 每 个 运 煤 车 中 取 走 一 部 分 煤 , 从 每 部 分 








孔 积 率 , 数据 在 表 中 给 出 . 煤 中 制备 两 个 样品 分 析 硫 含量 . 数据 在 附 表 中 给 
出 , 分 析 的 MINITAB 输出 如 下 . 
AUT 孔 积 率 a- 构造 方差 分 析 表 列 出 结果 . 
1 974 978 976 975 b. 数据 能 提供 足够 的 证 据 表 明 不 同 天 之 间 硫 含量 的 
2 981 985 978 986 变异 超过 同一 天 内 的 变异 吗 ? 用 a =0.05 检验 . 
3 1014 — 1012 1018 1010 —  — 
4 990 996 989 988 日 期 
5 1012 1009 1011 1012 1 2 3 4 5 
6 978 980 974 982 . 1 0.107 0.091 0.110 0.088 0.089 
7 ogg 979 986 983 0.105 0.089 0.113 0.092 0.088 
8 104 1001 1008 1008 2 0.104 0.093 0.108 0.091 0.087 
o ogo 984 op 983 0.103 0.090 0.110 0.093 0.089 
同一 天 内 3 0.101 0.092 0.111 0.092 0.092 
— 10 %9 1402 ^ 998 103 的 运 煤 车 0.099 0.093 0.108 0.089 0.090 
4 0.106 0.091 0.106 0.088 0.091 
a. 对 数据 进行 方差 分 析 , 给 出 ANOVA 汇总 表 . 0.105 0.091 0.108 0.087 0.090 
b. R o2 Alo? 的 估计 . 5 0.108 0.092 0.106 0.091 0.086 


c. 数据 能 提供 足够 的 证 据 表明 纸 片 间 孔 积 率 的 变 一 一 0-104 0.090 0.109 0.088 0.089_ 


异 超过 纸 片 内 孔 积 率 的 变异 吗 ? 


e 
= 
No 


14.41 BJ 44 de JR. 杜邦 的 质量 控制 工程 师 用 Nested ANOVA: SULFUR versus DAY, CAR 
套 式 抽样 方案 确定 符合 规格 装运 产品 的 百分比 . Analysis of Variance for SULFUR 
首先 , 随机 选择 个 生产 批 样本 ; 然后 , 在 每 个 生 Source DF ss "s " : 
产 批 中 随机 选择 n, 批 随机 样本 . 最 后 ， 在 每 个 批 中 DAY 4^ 0.0034 0.0008 135.300 0.000 
随机 地 选择 n 个 装运 批 进 行 验 查 . 假定 n= CAR 20 0.0001 0.0000 2.288 0.025 


Error 25 0.0001 0.0000 


10, n; =5, n4 =20, 对 这 个 套 式 抽样 设计 的 方 Total 49 0.0036 
差分 析 , 给 出 来 源 和 自由 度 . . 
14.42 ”开采 的 煤 中 的 硫 含量 . 进行 一 个 试验 估计 由 练习 14.42 的 MINITAB 输出 





© Henderson, R. K“ On Making the Transition from Inspection to Process Control. " Paper presented at Joint Statistical Meetings , 
American Statistical Association and Biometric Society , August 1986 , Chicago, IL. 
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c. 数据 能 提供 足够 的 证 据 表 明 一 天 内 运 煤 车 之 间 的 来 源 是 随时 变化 的 , 所 以 我 们 期 望 生产 的 纸张 


硫 含量 的 变异 超过 煤 样品 内 的 变异 ” 用 a = 强度 也 随 着 变化 . 为 了 检验 这 个 理论 ， 从 为 期 4 个 
0.05 检 验 . 月 时 间 中 随机 选择 6 天 , 对 这 6 天 中 的 每 天 , 从 三 


14.43 硅 晶 体 的 电阻 率 . 进行 一 项 试验 以 监测 单 晶 个 随机 选择 的 卷 中 选取 卷 尾 的 一 小 块 纸 片 . 对 18 
硅 的 电阻 率 . 根据 二 阶 套 式 抽样 设计 收集 原始 数 块 纸 片 的 每 一 片 进行 两 次 强度 测试 , 强度 测量 值 
. 据 , 8 个 晶体 的 随机 样本 选 自 其 中 的 30 批 . 其 中 5 (lb/in ) 在 表 中 给 出 . 





批 测量 的 晶体 电阻 率 在 附 表 中 给 出 . a. 利用 本 节 提 供 的 公式 对 数据 进行 方差 分 析 , 构 

a. 构造 套 式 设计 的 AVONA 汇总 表 . 造 方差 分 析 表 列 出 这 些 结果 . 

— uu O b. 这 些 数 据 是 否 提 供 足 够 的 证 据 表明 不 同 天 之 间 
A EMANE 纸 的 强度 的 变异 超过 同一 天 内 强度 的 变异 ? 用 
1 28 27 23 26 27 23 27 2.7 a =0.05 检验 . 

2 3.0 3.0 2.8 2.4 3.0 3.2 29 24 c. 这 些 数据 是 否 提供 足够 的 证 据 表 明 不 同 纸 卷 之 
3 24 23 24 29 24 24 23 23 间 的 强度 变异 超过 同一 卷 内 的 强度 变异 ? 用 
4 31 29 30 3.0 26 3.0 29 3.0 a =0.058938. 

5 31 33 29 25 25 31 25 3.0 日 其 


资料 来 源 : Hoshide , M. “ Optimization of lot size for quality as- 
surance of silicon wafers. ” Reports of Statistical Application Re- 
search, Union of Japanese Scientists and Engineers, Vol. 19, 1 20.7 22.1 19.0 20.6 23.2 20.7 
No. 1,1972 ‚pp. 8 - 21. 





b. o 和 oy 分 别 表示 电阻 率 读数 的 批 间 和 批 内 的 
方差 分 量 , K op 和 oy 的 估计 . 的 纸 尖 

co。 数据 是 否 提供 充分 的 证 据 表明 批 间 的 电阻 率 的 20.1 22.5 19.3 20.1 22.9 21.3 
变异 超过 批 内 的 变异 ? 用 a =0.05 检验 . 3 19.9 20.9 20.2 20.7 23.4 20.0 
14.44 造纸 原料 的 特性 . 纸 的 强度 依赖 于 进入 造纸 
机 木材 纤维 原料 的 长 度 和 其 他 特性 . 因为 纤维 原料 


14.8 处理 均值 的 多 重 比较 


许多 实际 试验 是 为 了 确定 一 个 集合 中 的 最 大 (或 最 小 ) 的 均值 . 例如 , 假定 某 化 学 家 开发 了 5 种 
从 金属 设备 消去 腐蚀 性 物质 的 化 学 溶剂 , 化 学 家 想 确 定 在 单 次 应 用 中 , 从 设备 除去 最 大 量 腐蚀 性 物 
质 的 溶剂 . 类 似 地 , 生产 工程 师 可 能 想 要 确定 6 部 机 器 中 或 3 位 领班 中 哪 一 个 达到 每 小 时 最 高 的 平 
均 生 产 率 , 机 械 工程 师 可 能 想 要 从 5 个 之 中 选择 一 个 最 有 效 的 发 动机 等 等 . 

一 旦 用 ANOVA 发 现 了 譬如 说 5 个 处 理 均值 间 有 差异 , 那么 选择 有 最 大 均值 的 处 理 似乎 就 是 
一 个 简单 的 事情 . 例如 , 可 以 得 到 样本 均值 7 yo, ce, ys, 构造 每 对 处 理 均值 间 差异 的 (1 - a) 
10056 的 置信 区 间 来 比较 它们 . 然而 , 这 个 过 程 中 有 一 个 问题 : — a -Ai 的 置信 区 间 以 及 相应 
的 a 值 是 有 效 的 , 仅 当 比较 的 两 个 处 理 ( 和 j) 是 在 试验 前 选择 的 . 在 看 过 数据 之 后 ,就 不 能 用 置 
信 区 间 去 比较 具有 最 大 和 最 小 样本 均值 的 处 理 , 因为 在 平均 意义 上 , 它们 都 不 再 是 任何 随机 选择 
的 处 理 对 . 而 且 , 如 果 构 造 一 系列 置信 区 间 , 每 一 个 有 a 的 可 能 性 表明 在 均值 对 之 间 有 差异 , 如 
果 事 实 上 没有 差异 存在 . 那么 , 在 一 系列 的 推断 中 至 少 一 次 犯 1 型 错误 的 风险 将 大 于 为 单个 区 间 
指定 的 o 值 . 

比较 和 排序 一 组 处 理 均值 有 许多 方法 . 一 种 普遍 的 方法 称 为 图 基 方 法 , 是 利用 学 生化 极 差 


20.5 22.1 19.4 19.2 24.6 18.6 
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_ Ymax — Ymin 
17 s/n 

GEB y... fl y. ral E CR E] NI EE AES f) 确定 任意 一 对 样本 均值 的 差异 是 否 意味 着 相应 的 处 
理 均 值 间 的 差异 . 

支持 这 种 多 重 比较 方法 的 逻辑 是 如 果 我 们 对 最 大 和 最 小 的 样本 均值 之 间 的 差异 17,。 ~ min | MA 
定 了 一 个 临界 值 ， 意味 着 在 它们 的 各 个 处 理 均值 间 有 差异 ， 那么 任何 其 他 一 对 样本 均值 的 差异 大 于 
这 个 临界 值 就 意味 着 相应 的 处 理 均值 间 有 差异 . 图 基 ( 1949 ) 方 法 选择 这 个 临界 距离 o, 使 得 犯 一 个 
或 多 个 工 型 错误 (断定 一 对 处 理 均值 之 间 存 在 差异 ， 如 果 事实 上 它们 相等 ) 的 概率 是 a. 因此 , 犯 工 型 
错误 的 这 个 风险 适用 于 整个 过 程 ， 即 比 较 试验 中 所 有 的 均值 对 , 而 不 是 单 次 比较 . 因此 , 研究 者 选择 
的 a 值 称 为 试验 错误 率 (与 比较 错误 率 相 对 照 ). 

图 基 方 法 依赖 于 p 个 样本 均值 基于 独立 随机 样本 ,每 个 包含 相等 的 观测 值 个 数 n, 的 假定 . 那么 
如 果 对 这 个 分 析 s = /MSE 是 计算 的 标准 差 , 距离 w 是 ， 

o -q(p,v) "s 

制 成 表 的 统计 量 qa (p,z) 是 学 生化 极 差 的 临界 值 ,， 位 于 q 分 布 的 上 尾 a 处 的 值 . 这 个 临界 值 依赖 于 
e, 包含 在 比较 中 的 处 理 均 值 个 数 p, 以 及 与 MSE 关联 的 自由 度 >， 如 下 所 示 . 对 a 20.05, K a= 
0.01 的 g(p, >) 值 分 别 在 表 B. 13 和 表 B. 14 中 给 出 . 








图 基 多 重 比 较 方法 : 相等 样本 量 


l. 选择 要 求 的 试验 的 错误 率 a. 
2. 计算 
o -q,(p, s 
其 中 : 
p= 样本 均值 的 个 数 
s= VMSE 


p= 5 MSE 关联 的 自由 度 
n, =p 个 样本 的 每 一 个 样本 中 观测 值 个 数 
q. (p, v) = 学 生化 极 差 的 临界 值 ( 表 B. 13 和 表 B. 14) 
. 计算 p 个 样本 均值 并 排序 . 
4. 在 差别 小 于 w 的 处 理 均值 对 加 一 条 上 横 线 ; 任意 没有 用 上 划 线 连接 的 处 理 对 ( 即 差别 大 于 ww 的 ) 意 
味 着 相应 的 总 体 均 值 之 间 有 差异 . 
Ba 由 这 个 分 析 得 到 的 所 有 推断 ,关联 的 置信 水 平 是 (1 a). 


U 














参考 例 14. 3 中 完全 随机 化 设计 的 ANOVA. 回想 在 a =0.05 F, 我 们 拒绝 三 种 涂料 直至 
出 现 可 见 磨损 的 平均 时 间 之 间 没有 差异 的 原 假设 . 用 图 基 方 法 比较 三 种 处 理 均值 . 
解 步骤 1 对 这 个 分 析 , 选择 试验 的 错误 率 a =0.05. 
步骤 2 由 前 几 个 例子 , 我 们 有 p=3 个 处 理 , y =27 个 误差 自由 度 , s= /MSE = 168.95, 日 每 个 
处 理 有 n, 2 10 个 观测 值 . 学 生化 极 差 的 临界 值 ( 由 表 B. 13 得 到 ) 是 go 94 (3, 27) =3.5. 
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将 这 些 值 代入 w 的 公式 中 , 我 们 得 到 
s 168. 95 
o - ms G2 (7) -3.5| 条] =187.0 
步骤 3 这 三 种 涂料 的 样本 均值 (由 表 14.2 得 到 ) 是 
Jı =229.6 5,-309.8 y,-427.8 
步骤 4 基于 临界 差异 w =187, 这 三 种 处 理 均值 排列 如 下 . 
样本 均值 : 229.6 309.9 427.8 
处 理 : 第 1 种 第 2 种 第 3 种 
间 样 的 信息 可 用 统计 软件 包 得 到 , 图 基 分 析 的 SAS 输出 在 图 14. 26 中 给 出 . 图 基 的 临界 差异 
e =187.33 是 输出 的 阴影 部 分 . (由 于 四 含 五 人 这 个 结果 与 我 们 的 计算 有 了 略微 不 同 . ) 注 意 到 SAS 以 降 
序 垂直 列 出 了 处 理 的 均值 , 由 相同 字母 ( A、B、C 等 ) 相 联 的 处 理 均值 没有 显著 不 同 . 
从 这 些 信 息 我 们 推断 第 3 种 涂料 的 平均 磨损 时 间 显著 地 大 于 第 1 种 涂料 的 平均 磨损 时 间 ， 因 为 
ys 超过 7 的 超出 量 大 于 临界 值 . 然而 ,处 理 对 (1,2) 和 (2,3) 由 一 条 上 横 线 (或 相同 的 字母 ) 相连 ,， 因 
为 (到 - YifüCOYs -大 ) 都 不 超过 o. 这 表明 这 些 处 理 对 的 样本 均值 没有 显著 差异 . 事实 上 , 这 些 结果 
意味 着 直至 出 现 可 见 磨损 , 第 3 种 涂料 有 最 大 的 平均 时 间 , 第 1 种 涂料 最 低 . 而 第 2 种 涂料 的 均值 与 
为 两 个 均值 没有 显著 差异 . 这 些 推断 是 在 总 的 置信 水 平 (1 - a) =0.95 时 做 出 的 . 








The ANOVA Procedure 
Tukey's Studentized Range (HSD) Test for WEAR 


NOTE: This test controls the Type | exper imentwise error rate, but it generally has a higher 
Type || error rate than REGHG. 


filpha 0.05 
Error Degrees of Freedom 
Error Mean Square 28543.37 


Critical Value of Studentized Range 3.50643 
Minimum Significant Difference 187.33 


Means with the same letter are not significantly different. 


Tukey Grouping Mean N TYPE 
n 427.80 10 3 
B A 303.90 10 2 
B 229.60 10 1 











图 14.26 4514.17 磨损 均值 的 图 基 排 序 的 SAS 输出 


记 住 图 基 多 重 比较 法 要 求 各 处 理 的 样本 容量 是 相等 的 . 这 对 分 别 在 14. 4 3530 14.5 节 中 描述 的 
随机 化 区 组 设计 和 析 因 试验 当然 是 满足 的 . 然而 , 在 完全 随机 化 设计 (14.3 节 ) 中， 样本 容量 可 能 不 
相等 . 在 这 种 情况 下 , 需要 修正 图 基 法 (有 时 称 图 基 - 克拉 默 方法 ) (如 下 面 框 格 所 述 ). 这 种 技术 需 
要 对 试验 中 的 每 个 处 理 对 (i, j) 计 算 临 界 差 wj ， 且 基于 这 个 适当 的 wy 进行 成 对 比较 . 然而 ， 当 图 基 
方法 用 于 不 等 样本 容量 时 , 由 研究 者 事先 选择 的 a 值 只 是 近似 于 真实 的 试验 错误 率 . 事实 上 ， 当 应 
用 于 不 等 样本 容量 时 , 发 现 这 种 方法 是 比较 保守 的 ， 即 当 处 理 均 值 对 之 间 的 差异 存在 时 , 检 出 这 种 
差异 的 可 能 性 小 于 等 样本 容量 的 情况 . 由 于 这 个 原因 ， 当 样 本 量 不 等 时 研究 者 有 时 希望 寻找 另 一 种 
多 重 比较 方法 . 这 种 方法 之 一 就 是 鲍 费 罗 尼 方 法 . 
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不 等 样本 容量 时 的 图 基 近 似 多 重 比较 方法 


l. 选择 要 求 的 试验 错误 率 a. 
2. 对 每 个 处 理 对 (i, ab 

s 1 1 

autas) fe 


其 中 : 
P= 样本 均值 的 个 数 
s= /MSE 
v= 与 MSE 关联 的 自由 度 
n= 处 理 i 的 样本 观测 值 个 数 
n; = 处 理 j 的 桩 本 观测 值 个 数 
q. (p, v) = 学 生化 极 差 的 临界 值 ( 表 B. 13 fu B. 14) 
3. 对 个 样本 均值 排序 , 并 在 差异 小 于 wy 的 处 理 均值 对 (让 D EAR Faba. 任何 没有 用 上 横 线 连接 的 
处 理 均值 对 ( 即 差 大 于 ww 的) 意味 着 相应 的 总 体 均值 之 间 有 差异 . 
注 : 这 个 方法 是 近似 的 ， 即 研究 者 选择 的 a 值 近似 于 至 少 犯 一 次 型 错误 的 真实 概率 . 











鲍 费 罗 尼 方法 是 基于 下 面 的 结果 (证 明 省 略 ) : 如 果 做 g 次 比较 ， 每 次 置信 系数 为 1 - og, 那么 
犯 一 次 或 多 次 T 型 错误 ( 即 试验 的 错误 率 ) 的 总 概率 至 多 为 w， 即 用 鲍 费 罗 尼 方法 构造 的 区 间 集 给 出 
的 总 置信 水 平 至 少 是 1 — o. 例如 , 如 果 想 以 至 多 w =0.05 成 对 试验 的 错误 率 构造 g =2 个 置信 区 间 ， 
那么 每 个 单个 区 间 必 须 用 1 -0.05/2 =0.975 的 置信 水 平 构造 . i 

当 应 用 处 理 均值 的 成 对 比较 时 ， 鲍 费 罗 尼 方法 可 通过 比较 两 个 处 理 均值 的 差异 (7 一) 与 临界 
差异 B; 来 实现 , 其 中 Bj 依赖 于 n,nj,a,MSE 以 及 被 比较 的 处 理 总 数 ， 如 果 样 本 均值 间 的 差异 超过 临 
界 差 异 , 则 有 充分 的 理由 推断 总 体 均值 不 同 . 执行 鲍 费 罗 尼 多 重 比 较 方法 的 步 又 在 框 格 中 给 出 . 





处 理 均 值 成 对 比较 的 鲍 费 罗 尼 多 重 比较 方法 : 
其 中 : 


l. 选择 试验 的 错误 率 a. 
B; = (1,.5) (3) [二 + 十 
P= 试验 中 样本 ( 处理) 均值 的 个 数 


2. 对 每 个 处 理 对 (i, j) 计算 Bi: 
£ = Xo H, 32 89 2 28 OE: 如 果 要 进行 所 有 的 成 对 比较 ,那么 g=p(p -1)/2) 
a` =a/g = 比较 的 错误 率 
s= /MSE 
n= 处 理 i 的 样本 中 观测 值 个 数 
n= 处 理 j 的 样本 中 观测 值 个 数 
v= MSE 关联 的 自由 度 个 数 
tw 三 自由 度 为 v 的 了 了 分布 的 临界 值 , 尾部 面积 为 wx /2( 表 B.7) 
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3. 计算 样本 均值 ， 并 排序 . 

在 差别 小 于 B; 的 处 理 对 (i, 门 上 画 一 条 横 线 . 任何 没有 由 上 横 线 连接 的 均值 对 都 意味 着 相应 的 总 体 均 
值 之 间 有 差异 . 

注 : 由 这 个 分 析 得 到 的 所 有 推断 关联 的 置信 水 平 至 少 是 (1 - a). 














CEEE 参见 例 14.17 中 三 种 涂料 平均 磨损 时 间 的 排序 . 

a. 用 鲍 费 罗 尼 方法 比较 三 个 处 理 均 值 . 

b. 与 图 基 方 法 比较 a 中 的 结果 . 

解 

a. 我 们 将 按 所 列 的 3 个 步骤 进行 . 

步骤 1 如 例 14.17 中 , 选择 试验 的 错误 率 a = 0.05. 

步骤 2 对 p=3 个 处 理 , 成 对 比较 的 个 数 为 ; 

g=p(p-1)/2=3(2)/2=3 

因此 , 调整 的 a 水 平 ( 即 比 较 的 错误 率 ) 是 a* =a/g = 0. 05/3=0. 017. 4 EL HIE v 927 HE T 
统计 量 的 临界 值 (由 统计 软件 包 得 到 ) 是 ta = Ho oz2) = loops 72. 55. 由 例 14. 17, RIIE s= 
VMSE = 168.95, HEMARA n; = 10 个 观测 值 . 将 这 些 值 代入 B 的 公式 , 我 们 得 到 

B = to. ogg (5), / (17n;) + (1/n;) =2. 55(168. 95) ,/2710=192, 7 


| The ANOVA Procedure 





Bonferroni (Dunn) t Tests for WEAR 


ROTE: This test controls the Type i experinentwise error rate, but it generally has a higher 
Type Ii error rate than REGHO. 


filpha 9.05 
Error Degrees of Freedom 27 
Error Mean Square 28543.37 
Critical Value of t 2.55246 


Minimum Significant Difference 1392.85 


Means with the same letter are not significantly different. 





Bon Grouping Mean N TYPE 
ñ 427.80 10 3 
B ñ 309.90 10 2 
8 229.60 10 1 








E 14.27 5814.18 磨损 时 间 鲍 费 罗 尼 排 序 的 SAS 输出 


步骤 3 根据 临界 差异 p 192.7, 三 个 处 理 均值 的 排序 如 下 ; 


样本 均值 : 229.6 309.9 427.8 
处 理 : 第 1 种 第 2 种 第 3 种 
CÈ: 这 些 结果 显示 在 图 14.27 的 SAS 输出 中 . ) 
b. 由 鲍 费 罗 尼 方法 得 到 的 结果 与 图 基 方 法 得 到 的 相同 ; 在 总 的 显著 性 水 平 为 0.05 时 , (1) 第 3 
种 涂料 的 平均 磨损 显著 地 高 于 第 1 种 涂料 的 相应 平均 值 ; (2) 第 2 种 涂料 的 均值 与 另外 两 个 平均 值 
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没有 显著 差异 . 然而 注意 到 鲍 费 罗 尼 临界 差异 妃 = 192.7 大 于 由 例 14. 17 得 到 的 图 基 临 界 差异 w = 
187.33. 因此 , 对 这 个 例子 , 利用 相同 的 比较 错误 率 ,图 基 方法 能 比 鲍 费 罗 尼 方法 检 出 更 小 的 处 理 
均值 的 差异 . 

例 14. 18b 的 结果 揭示 出 鲍 费 罗 尼 方法 比 图 基 方 法 产生 更 宽 的 处 理 均值 差 的 置信 区 间 . 无 论处 理 
的 样本 容量 是 否 相同 , 一 般 而 言 , 这 是 正确 的 . 因此 , 对 平衡 ANOVA 设计 ( 即 每 个 处 理 有 相同 样本 
容量 的 设计 ) 图 基 方 法 是 优良 的 多 重 比较 方法 . 然而 , 对 于 不 等 的 mn, 鲍 费 罗 尼 临 界 差异 通常 小 于 图 
基 临 界 差 异 . 因此 ， 当 设计 是 不 平衡 时 ( 即 处 理 的 样本 容量 不 等 时 ) 鲍 费 罗 尼 方 法 比 图 基 方 法 更 值得 
推荐 . 记 住 计算 鲍 费 罗 尼 临界 差异 所 需要 的 精确 7 了 值 , 在 大 多 数 教材 提供 的 T 表 中 不 可 能 得 到 . 如 果 
不 使 用 提供 这 些 信 息 的 统计 软件 包 , 那么 就 需要 估计 它 的 值 . 

一 般 地 , 执行 处 理 均值 的 多 重 比 较 仅 是 ANOVA 的 后 续 分 析 , 即 仅 在 进行 恰当 的 方差 分 析 严 检 
验 , 并 确定 在 处 理 均值 之 间 差 异 存在 的 充足 证 据 之 后 . 当 ANOVA F 检验 表明 在 少量 的 处 理 均值 之 间 
没有 明显 的 差异 时 ,进行 多 重 比较 要 谨慎 , 这 可 能 导致 混淆 且 矛 盾 的 结果 人. 

警告 :实际 上 , 当 相 应 的 ANOVA 下 检验 不 显著 时 , 避免 进行 少量 处 理 均值 的 多 重 比 较 是 明 每 的 ; 
否则 ， 可 能 出 现 混淆 且 了 矛盾 的 结果 . 


应 用 练习 平均 枝 / 根 比 1. 50 231 3.29 
14.45 训练 机 器 人 像 蚂 蚁 一 样 表现 . 参考 练习 14.4， 处 理 Tl T2 T3 
Naiure(2000 年 8 月 ) 训 练 机 器 人 像 蚂蚁 一 样 表现 
的 研究 . 用 0.05 试验 的 错误 率 对 4 个 大 小 不 同 的 
群落 的 平均 花费 能 量 进行 多 重 比较 . 结果 汇总 在 





a. 图 基 分 析 中 做 了 多 少 次 成 对 比较 ? 
b. 哪 种 处 理 产生 显著 地 最 高 的 平均 枝 / 根 比 ? 最 低 
的 呢 ? 





AT. 14.47. Snan BE. 全 麦 面包 有 较 高 含量 
样本 均值 — 0.97 0.95 0.93 0.80 植 酸 , 会 降低 营养 无 机 物 的 吸收 .Journal of Agri- 
群落 大 小 3 6 9 12 cultural and Food Chemistry(2005 年 1 月 )& Tp — 


项 研究 结果 , MER EIRE BH S E A € 


a， 分 析 中 进行 了 多 少 次 成 对 比较 ? 

b. 解释 表 中 给 出 的 结果 . 

14.46 树苗 生产 的 新 方法 . 在 Ecological Engineering 
(2004 年 2 H) rh, 一 种 树苗 生产 的 新 方法 ( 称 为 水 
族 森 林 系 统 ) 与 传统 的 树苗 转 方 法 进行 比较 . 将 新 
方法 应 用 于 4 种 在 洁净 水 域 (处 理 T1) 生 长 的 植物 
和 4 种 在 污染 水 域 (处 理 人 2) 生 长 的 植物 , 将 传统 
的 方法 (处 理 T3 ) 应 用 于 在 树苗 葡 中 生长 的 4 种 植 
物 . 因此 试验 设计 是 完全 随机 化 的 , 包含 3 个 处 理 . 
每 个 处 理 有 4 次 重复 (植物 ). 感 兴趣 的 因 变 量 是 新 
枝 重 量 与 根 重量 之 比 . 在 0.05 试验 的 错误 率 下 , 三 
个 处 理 均值 的 图 基 多 重 比较 得 出 结果 如 下 . 





面包 的 溶解 性 . 用 全 麦 粉 制备 4 种 面包 :(1) 加 酵 
母 菌 的 ; (2) 加 含 酵母 面团 的 ; (3) 没有 加 酵母 菌 
或 含 酵母 面团 (控制 ); (4) 加 入 乳酸 . 对 每 种 面包 
的 生 面团 样本 , 收集 在 发 酵 过 程 中 可 溶解 的 镁 水 
平 ( 镁 总 量 的 百分比 ) 的 数据 , 并 采用 单 向 ANOVA 
分 析 . 用 鲍 费 罗 尼 方法 配对 比较 这 4 个 平均 可 溶解 
镁 的 均值 , 结果 汇总 在 表 中 . 





均值 : 7% 12. 596 22% 27.5% 
面包 种 类 : 控制 组 ”加 酵母 菌 ”加 乳酸 ”加 含 酵母 面团 


a. 在 鲍 费 罗 尼 分 析 中 做 了 多 少 次 成 对 比较 ? 
b. 哪个 处 理 产 生 显 著 地 最 高 的 平均 可 溶解 镁 水 


S” 当 比较 大 量 的 处 理 时 ,一 个 难以 确定 、 不 显著 的 下 值 (例如 0.05 «p 值 <0.10) 可 能 掩盖 某 些 均值 之 间 的 差异 , 在 这 种 


情况 下 , 最 好 是 忽略 下 检验 直接 进入 多 重 比较 程序 . 
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平 ? 最 低 的 呢 ? 
c. 对 比分 析 试 验 错误 率 是 0.05 ,解释 这 个 值 . 

14.48 燃气 轮机 的 冷却 方法 . 参考 练习 14.6. Hii 
费 罗 尼 方法 比较 三 种 燃气 轮机 引擎 的 平均 热 耗 率 . 
用 a 20.06 检验 . 

14.49 估计 冰 渍 物 的 年 龄 . 参考 练习 14.9. HLE 
比较 方法 比较 5 个 钻井 的 平均 AVBe Ez, 用 wa = 
0.05 指 出 呈现 差异 的 平均 值 . 

14.50 茂 著 胺 对 记忆 的 影响 . 参考 练习 14. 11. Be- 
havioral Neuroscence (2004 年 2 月 ) BF2225 SE 
对 词 对 关联 记忆 的 影响 . 研究 人 员 的 理论 认为 注射 
黄 营 胺 的 受 试 者 (组 1) 回忆 的 词 对 平均 数 将 小 于 
注射 安奈 剂 的 受 试 者 (组 2) 和 没有 任何 药物 的 受 
试 者 (组 3) 的 相应 平均 . 进行 三 个 均值 的 多 重 比较 
(利用 0.05 试验 的 错误 率 ), 结果 支持 研究 人 员 的 
理论 吗 ? 请 解释 . 

14.51 修复 管道 裂缝. 参考 练习 14.17. 用 多 重 比 较 
法 比较 4 个 温 湿 期 间 的 平均 裂缝 宽度 . 指出 呈现 差 
异 的 平均 值 . Flo =0.05. 

14.52 语言 识别 器 . 参考 练习 12.22. Human Factors 
(1990 年 4 月 ) 关 于 计算 机 化 语言 识别 器 的 性 能 研 
究 , 有 三 水 平 (90% , 95% , 99% ) 的 识别 准确 度 和 
三 水 平 (75% , 87.5% , 100% ) 的 词汇 量 . 对 任务 完 
成 时 间 ( min) 的 数据 进行 3 x3 析 因 设计 的 方差 分 
Wr, 得 到 的 准确 度 x 词汇 量 交互 作用 成 检验 给 出 
的 p 值 小 于 0.0003. 

a. 解释 关于 交互 作用 的 检验 结果 . 
b. 作为 交互 作用 的 后 续 检 验 , 在 每 个 词汇 量 水 平 
下 对 准确 度 的 三 个 水 平 比较 平均 完成 任务 时 


14.9 检查 ANOVA 假定 


间 , 你 赞同 这 种 分 析 方法 吗 ? 请 解释 . 

e. 参考 b, 对 每 个 词汇 量 水 平 , 在 试验 的 错误 率 为 
a =0.05 F, 用 图 基 多 重 比较 方法 比较 三 个 准确 
度 的 均值 , 将 结果 汇总 在 这 里 , 解释 这 些 结果 . 














u 准确 度 水 平 
词汇 量 
99% 95% 90% 
75% 15.49 19.29 22.19 
87. 5% 12.77 14.31 16. 48 
100% 8.67 9. 68 11. 88 


一 一 一 -一 -一 -一  _ 
资料 来 源 ; Casali, S. P., Williges, B. H. , and Dryden, R. D. 
“ Effects of recognition accuracy and vocabulary size of a speech 
recognition system on task performance and user acceptance. ” 


Human Factors, Vol. 32, No. 2 |, April 1990 , p. 190( Figure 2). 


14.58 面包 酵母 和 啤酒 酵母 . 参考 练习 14.23 Elec- 
tronic Journal of Biotechnology(2003 4E 12 JJ 15 H) 
关于 比较 啤酒 酵母 与 面包 酵母 中 酵母 膏 的 研究 . [l 
忆 所 用 的 2 水 平 酵母 膏 和 4 水 平 温度 的 2 x4 析 因 
设计 . 对 两 种 酵母 膏 中 的 每 种 进行 4 个 温度 平均 值 
的 多 重 比较 , 解释 下 面 给 出 的 结果 . 





eC 
面包 酵母 :平均 量 (%): 41.1 47.5 48.6 50.3 
WEC): 54 45 48 51 





啤酒 酵母 : 平均 量 (%):39.4 — 47.3 49.2 49.6 
ECC): 54 51 48 45 
m 
14.54 焊接 处 的 强度 . 参考 练习 14.28. 利用 多 重 比 
较 法 比较 4 个 锁 量 的 平均 抗 前 强度 , 指出 呈现 差异 
的 平均 值 , 用 w =0.01. 


对 本 章 讨论 的 每 个 试验 和 设计 , 我 们 在 相关 的 框 格 中 列 出 了 用 ANOVA 分 析 的 基本 假定 . 例如 ， 
在 14. 3 节 的 框 格 中 , 完全 随机 化 设计 的 假定 为 :( 1) 相 应 于 p 个 处 理 的 响应 y 的 p 个 概率 分 布 是 正 态 
的 ; (2) p 个 处 理 的 总 体 方差 是 相等 的 . 类 似 地 ， 对 随机 化 区 组 设计 和 析 因 设计 ,处 理 的 数据 必须 来 


自 有 等 方差 的 正 态 概率 分 布 . 


这 些 假定 等 价 于 回归 分 析 中 所 要 求 的 ( 见 11.2 节 ). 原因 当然 是 每 个 设计 的 响应 y 的 概率 模型 是 
第 11 章 中 熟知 的 一 般 线 性 回归 模型 . 用 于 检查 ANOVA 假定 方法 的 主要 点 如 下 . 


检测 非 正 态 总 体 


1. 对 每 个 处 理 , 绘制 响应 y 的 直方 图 、 茎 叶 图 或 正 态 概 率 图 寻找 严重 的 有 偏 分 布 . ( 注 : 对 相 
对 大 的 样本 , 如 每 个 处 理 有 20 个 或 更 多 的 观测 值 ， 像 回归 一 样 ,ANOVA 关于 正 态 性 假定 是 


596 第 14x 





“稳健 ”的 , 即 与 正 态 性 微小 的 偏离 对 由 分 析 得 到 的 推断 的 有 效 性 只 有 很 小 的 影响 ) 如 果 每 
个 处 理 的 样本 容量 较 小 , 那么 这 些 图 的 用 处 可 能 是 有 限 的 . 

2. 也 可 以 使 用 正 态 性 的 正规 统计 检验 (如 安德森 - 达 林 检验 , 沙 皮 洛 - 威 尔 克 检验 或 柯 尔 莫 哥 
罗 夫 -斯 米尔 诺 夫 检验 ). 原 假设 是 响应 y 的 概率 分 布 是 正 态 的 , 然而, 这 些 检验 对 正 态 性 的 
略微 偏离 是 敏感 的 . 因为 在 大 多 数 科 学 应 用 中 , 正 态 性 假定 并 不 精确 满足 ,这些 检验 可 能 给 
出 拒绝 原 假设 , 所 以 , 在 实际 中 有 限 使 用 . 关于 这 些 正规 检验 的 更 多 信息 可 查看 参考 文献 . 

3. 如果 响 应 的 分 布 极 大 地 偏离 正 态 性 , 正 态 化 变换 也 许 是 必须 的 . 例如 ， 对 非常 偏 的 分 布 , 关 
于 响应 y 进行 诸如 log(y) 或 Vy 的 变换 使 数据 趋 于 “ 正 态 化 ”， 因为 这 些 函 数 将 分 布 尾部 的 观 
测 值 向 均值 “ 拉 ” 回 . 

检测 不 等 方差 

L. 对 每 个 处 理 , 对 y 绘制 盒子 图 或 频率 (点 ) 图 ,寻找 散布 (变异 性 ) 方 面 的 不 同 . 如 果 在 每 个 图 
中 响应 的 变异 性 是 大 致 相等 的 , 那么 等 方差 的 假定 可 能 是 满足 的 . ( 注 ， 对 于 平衡 设计 即 对 每 
个 处 理 有 等 样本 容量 的 设计 , 对 ANOVA 不 等 方差 是 稳健 的 . ) 

2. 当 每 个 处 理 的 样本 容量 较 小 时 , 频率 图 上 只 有 几 个 点 ， 很 难 发 现 变异 的 不 同 . 在 这 种 情况 下 ， 
可 能 希望 使 用 的 几 种 正式 的 方差 齐 性 统计 检验 方法 之 一 . 对 p 个 处 理 , 原 假设 是 Hato? = 
03 =… -02, Hh o? 是 相应 于 第 i 个 处 理 的 响应 y 的 总 体 方差 . 如 果 所 有 p 个 总 体 都 是 近似 
ESK, 则 可 用 “巴特 利 特 ” 方 差 齐 性 检验 . 当 数 据 是 来 自 正 态 (或 接近 正 态 ) 分 布 时 , 巴特 利 
特 的 检验 很 好 . 然而 , 对 非 正 态 数据 结果 可 能 会 误导 ， 在 响应 明显 不 是 正 态 分 布 情况 下 ,“ 莱 
文 检验 "更 恰当 . 这 些 检 验 的 要 素 在 下 面 的 框 格 中 给 出 , 注意 ， 巴特 利 特 检 验 统计 量 依赖 于 样 
本 容量 是 相等 还 是 不 等 . 

3. 当 发 现 不 等 方差 时 ,使 用 11.10 节 中 讨论 的 响应 y 的 方差 稳定 化 变换 之 一 . 











方差 齐 性 的 巴特 利 特 检 验 
Hio =o2 =. =o 
到 : 至 少 两 个 方差 不 同 . 
检验 统计 量 ( 相等 的 样本 容量 ) : 
pg (n D pln s? - En 3] 
1+ +l 
3p(n-1) 


其 中 ,n=nm =n,=- =n, s? = 第 i 个 样本 的 样本 方差 , 5? =p 个 样本 方差 的 平均 - (22), In x =x 的 自然 
对 数 ( 即 底 是 e 的 对 数 )， 
检验 统计 量 (不 等 的 样本 容量 ) : 


B- [Sn-1)lns - (n; - Dn £ 








1 1 1 
lan {Ee Ea} 
RPs 第 之 个 样本 的 样本 容量 , 号 = 第 i 个 样本 的 样本 方差 ， 5? = 个 样本 方差 的 加 权 平 区 - 
(a Ds 
X(n,-1) 











) In x=% 的 自然 对 数 ( 即 底 是 e 的 对 数 )， 
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拒绝 域 : B >x, 其 中 从 是 位 于 自由 度 为 (p -1) 的 六 分 布 上 尾 面积 为 w 的 点 . 
假定 ; I。 独立 随机 样本 是 从 p 个 总 体 中 选取 的 . 
2. 所 有 pp 个 总 体 都 是 正 态 分布. 








方差 齐 性 的 莱 文 检验 
Hy ot = o =… =o 
H: 至 少 有 两 个 方差 不 同 
检验 统计 量 : FF = MST/MSE 





其 中 MST 和 MSE 是 对 变换 的 响应 变量 y* = ly, - Med, | 实施 p 个 处 理 的 ANOVA 得 到 的 ， Med, 是 处 理 p 的 
响应 值 y 的 中 位 数 . 
拒绝 域 : F> F,, RF F, 是 位 于 自由 度 V -(p-1)fy, -(n-p)U F 2s ER SUN E. 
假定 : 1， 独立 随机 样本 是 从 pp 个 处 理 总 体 中 选取 的 . 
2. 响应 变量 y 是 连续 随机 变量 . 

















参考 例 14. 3 中 完全 随机 化 设计 的 ANOVA, 回想 发 现 3 种 涂料 的 平均 磨损 时 间 之 间 的 差 
异 . 检查 这 个 分 析 是 否 满足 ANOVA 假定 . 

R ”首先 , 我 们 检查 正 态 性 假定 . 对 这 个 设计 , 每 个 处 理 (分 类 ) 只 有 10 个 观测 值 ; 所 以 ,对 每 
个 处 理 绘图 (例如 直方 图 或 共 叶 图 ) 并 不 能 得 到 多 少 信息 . 另 一 种 方法 是 将 3 个 处 理 的 数据 合并 ,对 
数据 集中 所 有 的 30 个 观测 值 画 直方 图 , 响应 变量 磨损 时 间 的 MINITAB 正 态 概率 图 在 图 14.28 中 给 
出 . 点 落 在 一 条 近似 直线 上 . 数据 的 正 态 性 检验 结果 也 图 14.28 中 (着 重 显示 ) 给 出 . 


Probability Plot of HOURS 
Normal 


Percent 






-100 O 100 200 300 400 500 600 700 800 
HOURS 


图 14.28 fJ 14.19 MINITAB 正 态 概率 图 和 正 态 性 检验 
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因为 检验 的 p 值 大 于 0.10, 所 以 没有 充分 的 证 据 (在 a =0.05) 推 断 数据 是 非 正 态 的 , 磨损 时 间 
看 来 好 像 来 自 正 态 分 布 . 

其 次 , 我 们 检查 等 方差 假定 . 图 14. 29 显示 的 是 MINITAB 磨损 时 间 散 点 图 ， 注意 每 个 图 中 响应 
的 变异 性 是 大 致 相同 的 ; 因此 , 等 方差 假定 看 来 是 满足 的 . 为 正式 检验 假设 , Ho: of? = oz = ox? , 进行 
方差 齐 性 的 巴特 利 特 检 验 和 莱 文 检验 . 我 们 求助 于 统计 软件 包 , 而 不 是 用 给 出 的 计算 公式 . 图 14. 30 
是 检验 结果 的 MINITAB 输出 , 两 个 检验 的 p 值 是 输出 的 阴影 部 分 , 因为 两 个 p 值 都 超过 了 a =0.05, 
所 以 没有 充分 的 证 据 拒绝 等 方差 的 原 假设 . 所 以 , 等 方差 的 假定 看 来 是 满足 的 . 


Dotplot of HOURS vs PAINT 








PAINT 





* 
» * . 里 . T . 
90 180 270 360 450 540 630 720 
HOURS 








EI 14.29 例 14.19 的 MINITAB 散 点 图 


Test for Equal Variances for HOURS 


Bartlett's Test 


Test Statistic 0.79 
P-Value 0.672 





Levene's Test 


Test Statistic 0.78 
P-value Qt 








PAINT 











100 150 200 250 300 350 400 450 
95% Bonferroni Confidence Intervals for StDevs 


图 14.30 fJ 14. 19 的 MINITAB 方差 齐 性 检验 


在 大 多 数 科学 应 用 中 , 这 些 假定 是 不 会 精确 地 满足 . 然而 , 从 轻微 偏离 假定 不 会 显著 性 地 影响 
分 析 或 所 推断 的 有 效 性 意义 上 来 说 , 这 些 方 差分 析 方 法 是 灵活 的 . 另 一 方面 , 假定 的 明显 背离 ( 例 
如 , 非常 数 方差 ) 应 该 怀疑 推断 的 有 效 性 . 因此 , 应 该 将 核实 假定 是 (近似 地 ) 满 足 的 , 成 为 标准 的 
惯例 . 


应 用 练习 de p" 检查 练习 14.21 的 完全 随 
14.55 燃气 轮机 的 冷却 方法 . 检查 练习 14.6 的 完全 机 化 ANOVA 的 假定 . 
随机 化 ANOVA 的 假定 . 14.59 焊接 口 的 强度 . 检查 练习 14.28 的 析 因 设计 
14.56 估计 冰川 的 年 龄 . 检查 练习 14.9 的 完全 随机 ANOVA 的 假定 . 
化 ANOVA 的 假设 . 14.60 发 现 零 件 的 早期 故障 . 检查 练习 14.30 的 析 


14.57 危险 的 有 机 溶剂 . 检查 练习 14. 10 的 完全 随 因 设 计 ANOVA 的 假定 . 
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快速 回顾 
(GE: 标记 星 号 ( * ) 的 术语 来 自 本 章 选 学 节 . ) 
重要 公式 


M LLL 


完全 随机 化 设计 : 
_ MST 


F= MSE 检验 处 理 
随机 化 区 组 设计 : 
FE 检验 处 理 
_MSB 检验 区 组 
MSE 
两 因子 的 析 因 设计 ， 
p  MS(A) 
MSE 检验 主 效 应 4 
MS(B 
pM KU UY B 
MS(AB 
pO 检验 4xB 交 互 作用 
“二 阶 套 式 设计 ; 
e MS) _ — 
F = NS(A rË D 检验 第 一 阶 因子 4 
F 2 MS(A)/MS(A 中 的 B) 检验 第 一 阶 因子 4 
F =MS(A 中 的 B8)/MS(B 中 的 C) 检验 第 二 阶 因 子 B 
图 基 多 重 比 较 : 


e qp, v)-— 每 个 处 理 有 等 样本 量 n, 的 临界 差异 ， 其 中 9 (p, v) ep 个 均值 的 标 
n, 准 化 极 差 值 , > 是 自由 度 , a 是 显著 性 水 平 





1 
osdal, Ya [Ie 不 等 样本 容量 和 的 临界 差异 
i j 
鲍 费 罗 尼 多 重 比较 : 
Bj = (tara) (s) / + 样本 容 ; Tn; . i 
ram EX n, Bon, 的 临界 差异 , 其 中 , a * =g = 比较 的 错误 率 ,w = 


试验 的 错误 率 , g =p(p -1)/2 =p 个 均值 的 成 对 比较 次 数 








符 ”号 wo BB 
ANOVA 方差 分 析 
SST 处 理 的 平方 和 ( 即 处 理 均值 间 的 变异 ) 
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SSE 误差 的 平方 和 ( 即 由 抽样 误差 引起 的 围绕 处 理 均值 的 变异 性 ) 

MST 处 理 的 均 方 
MSE 误差 的 均 方 (o? 的 估计 ) 

SSB 区 组 的 平方 和 

MSB 区 组 的 均 方 

axb bd 一 个 a 水平 的 因子 与 男 一 个 5 水 平 的 因子 的 两 因子 析 因 试验 (因此 试验 有 a x 个 处 

BE) 

SS(A) 因子 4 的 平方 和 

MS(A) 因子 4 的 均 方 

SS(B) AF B 的 平方 和 

MS(B) 因子 B 的 均 方 

SS(AB) 4 x 召 交互 作用 的 平方 和 

MS(AB) A x B 交互 作用 的 均 方 

* SS(A 中 的 B) 套 在 因子 4 中 的 因子 B 的 平方 和 

* MS(A 中 的 B) 套 在 因子 4 中 的 因子 B 85935977 

本 章 总 结 提示 


平衡 设计 是 每 个 处 理 的 样本 容量 都 相等 的 设计 . 

完全 随机 化 设计 中 正确 的 ANOVA F 检验 所 需 的 条 件 :(1) 所 有 p 个 处 理 的 总 体 都 是 近似 正 
态 的 ;(2)o? = oz = … = or. 

随机 化 区 组 设计 中 正确 的 ANOVA 尸检 验 所 需 的 条 件 : (1) 所 有 处 理 -区 组 总 体 都 是 近似 正 
态 的 ;(2) 所 有 处 理 - 区 组 总 体 都 有 相等 的 方差 . 

析 因 设计 中 正确 的 ANOVA F 检验 所 需 的 条 件 :.(1) 所 有 处 理 总 体 都 是 近似 正 态 的 ;(2) 所 有 
处 理 总 体 都 有 相同 的 方差 . 

ANOVA 是 稳健 方法 一 一 与 正 态 性 轻 度 到 适度 的 偏离 , 不 会 影响 结果 的 有 效 性 . 
试验 的 错误 率 是 在 ANOVA 中 进行 多 重 比 较 时 , 至 少 犯 一 次 I 型 错误 的 风险 . 

控制 成 对 试验 错误 率 的 多 重 比较 方法 : 图 基 和 鲍 费 罗 尼 . 

当 (1) 处 理 的 样本 容量 相等 ,(2) 要 求 处 理 均值 的 成 对 比较 时 ,图 基 方 法 是 恰当 的 . 

当 (1) 处 理 的 样本 容量 相等 或 不 等 ,(2) 要 求 处 理 均值 的 成 对 比较 时 鲍 费 罗 尼 法 是 恰当 的 . 


° 在 析 因 设计 中 的 主 效应 检验 , 仅 当 交互 作用 检验 不 显著 时 才 是 恰当 的 . 
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补充 应 用 练习 
14.61 计算 机 语言 识别 . 语言 识别 技术 已 经 发 
展 到 通过 口头 命令 与 计算 机 交流 成 为 可 能 . 进行 一 
项 研究 评估 在 人 类 与 计算 机 系统 相互 交流 中 语言 
识别 的 价值 . (Special Interest Group on Computer-Hu- 
”man Interaction Bulletin, 1993 年 7 月 ). 将 45 位 受 
试 者 样本 随机 分 成 三 组 (每 组 15 位 受 试 者 ) ， 要 求 
每 位 受 试 者 用 基本 语音 邮件 系统 完成 任务 , 各 组 
用 不 同 的 界面 : (1) 按 键 音 ; (2) 人 操作 ; (3) 模拟 
语音 识别 . 测量 的 变量 之 一 是 完成 指派 任务 的 总 时 
间 (s) ， 进 行 分 析 以 比较 三 组 的 平均 完成 任务 总 
时 间 . 
a 指出 这 个 研究 中 使 用 的 试验 设计 . 
. 提出 容许 比较 三 个 均值 的 回归 模型 . 
. 用 均值 给 出 适当 的 检验 原 假设 . 
. 用 b 中 模型 的 6 给 出 适当 的 检验 原 假设 . 
. 下 面 给 出 三 组 样本 的 平均 完成 时 间 , 尽管 样本 
均值 间 有 差异 , 但 在 a =0.05 F c 中 的 原 假设 
不 能 拒绝 , 解释 为 什么 这 是 可 能 的 . 


oO C a c 








组 平均 完成 时 间 (s) 
按键 音 1400 
人 操作 1030 
语音 识别 1040 





14.62 微量 元 素 的 浓度 . 维他命 (V) 最近 被 认为 是 
基本 的 微量 元 素 . 进行 一 项 试验 比较 用 同位 素 稀释 
质谱 法 测定 生物 物质 中 V 的 浓度 . (Analytical 
Chemistry, 1985 年 11 H). WI serp£ ibd WB ZR. 
柑橘 树叶 、 牛 肝脏 和 人 类 血清 的 干 样本 中 V 的 量 
(单位 ; ng/g). 





牡 是 组 织 ”柑橘 树叶 牛 肝脏 人 类 血清 
2.35 2.32 0.39 0.10 
1.30 3.07 0.54 0.17 
0.34 4.09 0.30 0.14 

0.16 
0.16 


资料 来 源 : Fassett, J. D. , and Kingston, H. M. “Determina- 
tion of nanogram quantities od vanadium in biological material 
by isotope dilution thermal ionization mass spectrometry with 
ion counting detection. " Analytical Chemistry, Vol. 57 , No. 
13, 1985 4E 11 H , p2475( 2). 


a. 指出 试验 中 的 处 理 . 

b， 有 充分 的 证 据 ( 在 a =0.05) 表 明 4 种 生物 物质 
中 平均 V 浓度 不 同 吗 ? 

c. 如 果 合 适 , 用 a = 0. 06 的 多 重 比较 法 对 处 理 的 
均值 排序 . 


14.63 ”焊接 剂 研究 . WITE AA RUE BKL E WJ 


评价 ,主要 目的 是 确定 三 种 元 素 一 一 镍 、 铁 或 铜 中 
哪个 是 最 好 的 焊接 剂 . 用 每 种 可 能 的 焊接 剂 焊接 一 
系列 锋 锡 合金 零件 , 因为 由 不 同 铸 块 制造 的 零件 
存在 很 大 的 变异 ,所 以 用 对 铸 块 分 组 的 随机 化 区 
组 设计 , 用 三 种 焊接 剂 中 的 每 种 将 来 自 同一 铸 块 的 
一 对 零件 焊 在 一 起 , 测量 分 离 焊接 的 零件 所 要 求 
的 压强 (单位 : 1000 Ib/in^). 数据 在 附 表 中 给 出 ， 























随后 是 部 分 ANOVA 汇总 表 . 
焊接 剂 
铸 块 
Ë 铁 E 
1 67.0 71.9 72.2 
2 67.5 68. 8 66. 4 
3 76.0 82.6 74.5 
4 72.1 78.1 67.3 
5 73.1 74.2 73.2 
6 65.8 70. 8 68.7 
7 75.6 84.9 69.0 
来 源 df SS MS F 
焊接 剂 2 131. 90 一 一 
铸 块 6 268. 29 一 一 
误差 12 124. 46 一 
总 和 20 524. 65 





a. 指出 试验 中 的 处 理 . 

b. 指出 试验 中 的 区 组 . 

c. 是 否 存在 证 据 表明 在 三 种 焊接 剂 中 分 离 零件 所 
需 的 压强 是 不 同 的 ? 取 a = 0.05. 


14.64 OR ka. 已 知 一 种 加 勒 比 蚁 子 种 类 抵抗 


某 种 杀 虫 剂 . 在 Journal of the American Mosquito 
Control Association( 1995 4E 5 H ) 中 ， 调查 了 5 种 不 
同 杀 虫 剂 ( 双 硫 磷 、 马 拉 硫 磷 、 杀 冥 硫 磷 、 倍 硫 磷 
FUSE PCIE) 在 控制 这 个 蚊 种 方面 的 效力 . 从 加 勒 比 
的 7 个 地 点 收集 蚊子 的 幼虫 , 在 实验 室 中 , 将 来 自 
每 个 地 区 的 幼虫 分 为 5 批 ， 每 批 暴露 在 5 ROS uml 
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中 的 一 种 , 记录 杀 死 50% 幼体 所 需 的 杀 虫 剂 剂量 ， 
并 除 以 受 影响 的 蚊子 品系 的 已 知 剂量 ,， 称 这 个 值 
为 抗 性 比 ,( 比率 越 高 , 蚊子 种 类 关于 受 影 响 的 蚊 
子 品系 的 杀 虫 剂 有 越 强 的 抵抗 力 . ) 研究 的 抗 性 比 
在 下 表 中 给 出 , 研究 者 想 比较 5 种 杀 虫 剂 的 平均 搞 


性 比 . 

a 解释 为 什么 试验 设计 是 随机 化 区 组 设计 , 指出 
处 理 和 区 组 . 

b. 对 数据 进行 完全 分 析 , 是 否 有 某 种 杀 虫 剂 比 其 
他 几 种 更 有 效 ? 


杀 虫 剂 








AA XU at 马 拉 硫 磷 ATDA feri Bt ry. 
Anguilla 4.6 1.2 1.5 1.8 1.5 
Antigua 9.2 2.9 2.0 7.0 2.0 
Dominica . I 7.8 1.4 2.4 4.2 4.1 
Guyana 1.7 1.9 2.2 1.5 1.8 
Jamaica 3.4 3.7 2.0 1.5 7.1 
St. Lucia 6.7 2.7 2.7 4.8 8.7 
Suriname 1.4 1.9 2.0 2.1 1.7 





资料 来 源 ， Rawlins, S. C. , and Oh Hing Wan, J. “ 





Resistance in some Caribbean populations of Aedes aegypti to several insecticides. " 


Journal of the American Mosquito Control Association, Vol. 11, No. 1, 1995 年 3 月 (X1). 


14.65 酸雨 研究 . 一些 环境 学 家 把 酸雨 看 作 国 家 最 
严重 的 环境 问题 , 它 由 云层 中 水 燕 气 与 来 自 煤 、 A 
油 及 天 然 气 燃烧 散发 的 氮 氧 化 物 和 二 氧化 硫 所 组 
成 . 在 佛罗里达 中 部 和 北部 , 雨 的 酸性 范围 一 致 地 
在 4.5 到 5 的 pH 值 内 , 一 个 明显 的 酸雨 条 件 . 为 
了 确定 酸雨 对 自然 生态 系统 中 土壤 酸性 的 影响 ， 
佛罗里达 大 学 的 食品 与 农业 科学 学 院 的 工程 师 们 
用 两 个 pH 水平 : 3.7 和 4.5 的 酸雨 灌溉 佛罗里达 
的 盖 恩 斯 维尔 附近 的 试验 田 , 然后 在 三 个 不 同 的 


深度 : 0 — 15cm, 15 ~30cm, 30 ~ 46cm 处 测量 土壤 

的 酸性 . 在 三 个 不 同 的 时 期 进行 检测 ， 得 到 的 土壤 

pH 值 在 下 表 中 给 出 . 把 试验 看 作 安 排 在 三 个 区 组 

的 2x3 的 析 因 试验 ， 其 中 因子 是 两 水 平 的 酸雨 和 

三 水 平 的 土壤 深度 , 区 组 是 三 个 时 期 . 

a. 存在 酸雨 的 pH 水 平和 土壤 深度 之 间 的 交互 作 
用 的 证 据 吗 ? 用 oa =0.05 检验 . 

b. 通过 检验 确定 对 时 间 分 组 是 否 能 有 效 地 去 除外 
部 变异 来 源 , 用 a 20.05 检验 . 


6 H 16 日 酸雨 pH 值 6 月 30 日 酸雨 pH 值 





4 月 3 日 酸雨 pH 值 

3.7 4.5 

0~15 cm 5. 33 5.33 

土壤 深度 15 ~30 cm 5. 27 5.03 
30 ~ 46 em 5.37 5.40 





资料 来 源 :“Acid rain linked to growth of coal-fired power. 


14.66 RENE XS TERK REEERE T E VR 
多 潜在 重要 工业 用 途 的 可 发 醇 碳水 化 合 物 ， 进行 
兹 汽 爆 炸 过 程 的 研究 以 确定 释放 可 发 醇 碳 水 化 合 
物 的 最 佳 条 件 ( Biotechnolegy and Bioengineering , 
1986 年 2 H). 在 燕 汽 爆 炸 过 程 中 的 0.5， 1.0, 


3.7 4.5 3.7 4.5 
5.47 5.47 5.20 5.13 
5.50 5.53 5.33 5.20 
5.80 5.60 5.33 5.17 





" Florida Agricultural Research 83 , Vol.2, No. 1, 1983 FRAR. 





2.0, 3.0 和 5.0 min & 170% , 200€ X 215€ F Ah 
理 泥炭 一 式 三 份 的 样本 . 因此 , 试验 包含 两 个 因 
于 一 一 三 水 平 的 温度 ,5 水 平 的 处 理 时间 . 附 表 给 
出 了 3 x5=15 个 泥 碳 样本 中 每 个 样本 的 增 溶 的 碳 
水 化 合 物 百 分 比 . 
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i CC) 时 间 (min) ” 增 溶 的 碳水 化 合 物 ( % ) 
170 0.5 1.3 
170 1.0 1.8 
170 2.0 3.2 
170 3.0 4.9 
170 5.0 11.7 
200 0.5 9.2 
200 1.0 17.3 
200 2.0 18.1 
200 3.0 18.1 
200 5.0 18.8 
215 0.5 12.4 
215 1.0 20.4 
215 2.0 17.3 
215 3.0 16.0 


215 5.0 15.3 


| 
资料 来 源 ; Forsberg, C. W. ,et al. “The release of ferment- 


able carbohydrate from peat by steam explosion and its use in 
the microbial production of solvents. " Biotechnology and Bio- 
engineering, Vol. 28, No. 2, 1986 4g 2 月 , 8B 179 
M( I). 


a. 使 用 哪 种 类 型 试验 设计 ? 

b. 解释 为 什么 传统 的 方差 分 析 公式 不 适 于 这 些 数 
据 的 分 析 . 

e. 写 出 联系 增 溶 的 碳水 化 合 物 的 平均 量 B(y) 与 温 
BE (xi) 和 时 间 (%, ) 的 二 阶 模型 . 

d. 解释 如 何 检验 两 因子 : 温度 (x, ) 和 时 间 (x, ) 交 
互 作 用 的 假设 . 

e. 如 果 能 够 使 用 统计 软件 包 , 拟 合 这 个 模型 并 进 
行 交互 作用 检验 . 

14.67 采油 钻头 比较 . 当 石油 钻井 的 成 本 以 史 无 前 
例 的 速度 上 涨 时 , 对 一 家 成 功 的 石油 公司 来 说 , 度 
量 钻 井 性 能 的 任务 是 至 关 重 要 的 . 降低 钻井 成 本 的 
一 个 方法 是 提高 钻井 速度 ,城市 服务 公司 的 研究 
人 员 开 发 了 一 种 称 为 PD-1 的 钻头 , 他 们 相信 PD-1 
比 市 场 上 任何 其 他 钻头 能 以 更 快 的 速度 穿 透 岩石 . 
决定 在 德 克 萨 斯 的 12 个 儿 井 位 置 比较 PD-1 与 其 
他 两 种 已 知 有 最 快速 度 的 钻头 IADC 1-2-6 和 IADC 
5-1-7 的 钼 并 速度, 给 每 个 钻头 随机 指派 4 个 地 点 ， 


当 每 个 地 点 销 孔 深 达 3 000 ft 后 以 fn 记录 穿 透 速 
度 (RoP) , 数据 在 表 中 给 出 . 城市 服务 公司 能 断言 
三 个 钻井 钻头 中 , 至 少 有 两 个 的 平均 RoP 不 同 吗 ? 
用 a =0. 05 检验 . WRES, 用 多 重 比较 方法 排列 
处 理 的 均值 . 








PD-1 IADC 1-2-6 IADC 5-1-7 
35.2 25.8 14.7 
30.1 29.7 28.9 
37.6 26.6 23.3 
34.3 30.1 16.2 


14.68 环 颈 旅 鼠 的 特性 . 当 秋 天 月 份 日 照 时 间 开 始 


减少 时 , 许多 温带 地 区 的 动物 类 表现 出 心理 和 形 
态 的 变化 . 进行 一 项 研究 调查 环 颈 旅 鼠 的 “ 短 晶 
HR" REGE (The Journal of Experimental Zoology, 1993 
年 9 B). 在 每 天 保持 22 h 光照 的 群体 中 繁殖 124 
AUBL, 断奶 时 (19 K), 测量 旅 鼠 的 重量 , 随机 指 
派 到 两 种 光照 期 之 一 的 条 件 下 生存 : 每 天 不 超过 
16h 光照 , 每 天 多 于 16 h 光照 . (每 组 指派 相同 个 
数 的 肉 性 和 雄性 . ) 10 周 之 后 , 再 次 测量 旅 鼠 的 重 
量 , 感 兴趣 的 响应 变量 是 在 10 — 周 试验 期 身体 重 
BHE e). 研究 人 员 用 2 x2 析 因 设计 的 ANO- 
VA 分 析 数 据 , 其 中 两 个 因子 是 光照 期 (两 水 平 ) 和 
性 别 (两 水 平 ). 
a. 构造 试验 的 ANOVA 3 , 列 出 变异 来 源 和 相应 的 
自由 度 . 
b. 给 出 能 使 研究 人 员 检 验光 照 期 和 性 别 交 互 作 用 
的 模型 . 
c. 交互 作用 的 下 检验 不 显著 , 解释 这 个 结果 的 实 
d. 检验 光照 期 和 性 别 主 效应 的 p 值 都 小 于 0.001, 
解释 这 个 结果 的 实际 意义 . 


14.69 去 除 纸 中 的 水 分 . 当 纸 通过 干燥 机 时 ,去 除 纸 


中 水 分 的 百分率 依赖 于 干燥 机 的 温度 和 纸 通 过 干 
燥 机 的 速度 . 进行 实验 室 试验 , 研究 三 水 平 的 干燥 
温度 T 和 暴露 时 间 E( 与 速度 有 关 ) 之 间 的 关系 , 进 
行 一 个 温度 在 100F、120 下 和 140 下 , 暴露 时 间 T 
TE 10 s, 20 s £030 s 的 3 x 3 析 因 试验 , 为 每 个 条 件 
制备 4 个 纸张 样品 , 数据 (去 掉 水 的 百分率 ) 在 下 
表 中 给 出 . 


AM 
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温度 (7) e. 求 出 并 解释 当 了 2140, E 230 时 平均 去 掉 水 百 
100 120 140 分 率 的 95% 置 信 区 间 . 
14.70 NX ES. 下 表 给 出 的 数据 是 为 调查 三 个 因 
10 24 36 3 33 46 49 子 对 灰 在 煤 中 的 百分比 影响 所 进行 的 试验 结果 . 
21 25 | 36 32 | 44 45 4 水 平 的 三 个 因子 都 为 
20 39 34 |51 5067 64 煤 的 类 型 (因子 4) : Mojiri, Michel „Kairan 和 Metal- 
SSMO) 3 40 | 47 52|68 65 lurgical coke. 
30 58 55 | 75 71 |89 8 最 大 微粒 尺寸 (因子 B) ; 246, 147 , 74 80 48pm. 
sé 3110 ms 8 所 选 煤 样品 的 重量 (因子 C): 1 g. 100 mg, 20 mg 


. 执行 数据 的 方差 分 析 , 并 建立 方差 分 析 表 . 

. 数据 是 否 提 供 充分 的 证 据 表 明 温 度 和 时 间 有 交 
互 作用 ? 用 a = 0. 05 检验 . 这 个 检验 的 实际 意 
义 是 什么 ? 


”对 数据 拟 合 二 次 模型 


E(y) =B, * BE +B,T +B,(E x T) +B, P +B, 
给 出 预测 方程 . 


和 5 mg. 


对 每 个 4x4 x4 264 个 因子 -水 平 组 合 制备 三 个 
样品 , 得 到 完全 4 x4 x4 析 因 试验 的 三 个 重复 . 


a. 


b. 


建立 给 出 各 个 来 源 和 自由 度 的 方差 分 析 表 . 
数据 提供 因子 间 有 交互 作用 的 证 据 吗 ?用 a = 
0.05 检验 . 


- 分 析 中 得 到 的 煤 灰 平 均 水 平 依赖 煤 样 品 的 重量 


m? 用 a=0.05 检验 . 














:估计 当 了 = 120, E =20 时 平均 去 掉 水 的 百分率 、 d. 在 最 大 颗粒 尺寸 的 4 个 水 平 中 的 每 个 水 平 , 求 
为 什么 这 个 值 与 该 因子 -水 平 组 合 得 到 的 4 个 Mojiri 和 Michel 之 间 平 均 煤 灰 量 差异 的 95% 置 
观测 值 的 样本 均值 不 同 ? fa EX la]. 

A, Mojiri A, Michel A, Kairan A4 Met. Coke 
重复 样本 —  _ 
X, X) X3 X; X; X3 Xx X) X3 x, X3 X3 
B, C, 7.30 7.35 7.42 |10.69 10.58 10.72|12.20 12.27 12.23 | 9.99 10.02 9.95 
C, 6.84 6.07 6.91 |10.26 10.35 10.42 11.85 11.85 12.05 | 9.45 9. 86 9.78 
C; 7.05 6.49 7.24 |10.61 10.08 10.31 |12.34 1174 11.44| 9. 76 | 9.79 9.77 
C, 6.75 5.62 7.24 |10.66 10.61 10.01|12.22 11.68 12.09 | 9.92 10.17 10.50 
B, Ci 7.56 7.44 7.51 |10.86 10.88 10.90 |12.47 12.42 12.44 | 9.87 9.81 9. 79 
C; 7.10 7.37 7.32 |10.45 10.62 10.87 |12.47 12.28 12.04 | 9.46 9. 60 9.62 
C, 7.41 7.60 7.49 |10.85 10.89 10.61 | 12.33 12.35 12.40 | 9.97 9.77 9.76 
C, 7.29 7.62 7.43 | 10.68 11.58 10.60 12.04 12.21 12.51 | 9.76 10.10 9.61 
B, Ci 7.51 7.64 7.58 |10.30 10.68 10.73 |12.42 12.41 12. 39 | 9.97 10.02 10.01 
C; 7.36 7.50 7.21 |10.33 10.50 10.64 12.05 12.30 12.20| 9. 78 10.02 9.91 
C, 7.56 7.55 7.47 |10.73 10.75 10.84 | 12.44 12.30 12.26 9.88 9.90 10.06 
C, 7.71 7.67 7.76 |10.92 10.80 10.79 | 12.11 12.02 12. 26 | 9.77 9.74 9. 69 
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(EE) 
A, Mojiri A, Michel A, Kairan Á, Met. Coke 
重复 样本 — - —— 
*i x) *3 * x X3 
B, C 7.45 7.49 7.47 10.06 10.07 10.11 


C; 7.15 7.68 7.18 
C; 7.60 7.55 6.61 
C, 8.06 7.05 7.57 





9.71 9.86 9.78 
10.13 9.93 10.01 
10.01 9.98 9. 84 





资料 来 源 : Fujimori, T. , and Ishikawa, K. “Sampling error on taking analysis-sample of coal after the last stage of a reduction process. " 
Reports of Statistical Application Research, Union of Japanese Scientists and Engineers, Vol. 19, No. 4, 1972, p. 22-32. 


14.71 玻璃 跃迁 温度 . 化 学 家 进行 实验 研究 4 个 处 
理 对 某 种 特殊 聚合 物 的 玻璃 跃迁 温度 (开尔文 度 ) 
的 影响 . 用 于 制造 这 种 聚合 物 的 原料 是 小 批 买 进 
89. 认为 同 批 次 中 的 原料 是 相当 均匀 的 ,而 不 同 批 
次 间 有 变化 . 因此 ,对 来 自 每 个 批 次 中 的 样本 执行 
每 个 处 理 , 结果 在 表 中 给 出 . 

a. 数据 能 否 提 供 充分 的 证 据 表 明 4 个 处 理 的 平均 
温度 有 差异 吗 ? 用 a =0.05 检验 . 

b. 有 充分 的 证 据 表 明 三 个 批 次 的 平均 温度 有 差异 
w? H a=0.05 检验 . 

c. 如 果 将 来 重新 进行 试验 , 那么 对 这 个 试验 的 设 
计 你 建议 作 什么 变化 吗 ? 





温度 
1 2 3 4 
1 576 584 562 543 
批 2 515 563 522 536 
3 562 555 550 530 


14.72 灌浆 沙 的 强度 . 在 生产 灰 浆 沙 中 所 用 的 催化 
剂 浓 度 认为 会 影响 它 的 强度 . 设计 一 个 试验 , 研究 
催化 剂 的 三 个 不 同 浓度 的 效应 , 每 个 浓度 用 5 个 灌 
浆 样 品 试验 , 将 测试 样品 放置 在 夹具 中 , 以 直到 样 
品 破坏 时 所 用 的 压力 确定 的 灌浆 沙 的 强度 ， 以 lb/ 
in^ 表示 的 破坏 样品 所 需 的 压强 在 下 表 中 给 出 . 数 
据 提 供 充 分 的 证 据 表明 催化 剂 的 三 个 浓度 中 灰 桨 
沙 的 平均 强度 有 差异 吗 ? 用 a =0.05 检验 . 





催化 剂 浓度 
35% 40% 45% 
5.9 6.8 9.9 
8.1 7.9 9.0 
5.6 8.4 8.6 
6.3 9.3 7.9 
7.7 8.2 8.7 


14.73 光 输 出 试验 . 进行 一 个 2x2 x2 x2 =2 的 析 


因 试 验 调查 4 个 因子 对 闪光 灯 的 光 输 出 y 的 影响 ， 
对 每 个 析 因 处 理 取 两 个 观测 值 . 因子 是 : 灯泡 中 第 
的 量 (100 mg 和 120 mg) ; 封装 机 的 速度 (1.2 r/min 
和 1.3 r/min); 轮班 ( 日 班 或 夜班 ) ; 机 器 操作 者 (A 
ak B).2* 析 因 试验 的 两 次 重复 数据 在 下 面 给 出 . 
为 简化 计算 , 令 
量 -110 


x, = 


_ 速度 -1.25 


10 2 0.05 
所 以 EIL os 将 取 值 为 -1 和 +1. 另 外 ， 
nf 如 果 是 夜班 =- 人 如 果 是 操作 者 B 
1 如 果 是 日 班 1 如 果 是 操作 者 A 

a. 数据 提供 充分 的 证 据 表 明 因 子 对 y 的 预测 贡 
信息 ?给 出 支持 答案 的 统计 检验 的 结果 . 

b. 指出 可 能 影响 办 光 灯 中 光量 y 的 因子 . 

c. 给 出 y 的 完全 析 因 模型 . (提示 : 对 有 4 个 因子 
的 析 因 试验 ,完全 模型 包含 每 个 因子 的 主 
效应 、 两 因子 交叉 乘积 项 、 三 因子 交叉 乘 
积 项 和 4 因子 交叉 乘积 项 . ) 

d. 为 估计 oo?, 可 用 的 自由 度 是 多 少 ? 

销量 
100 mg 120 mg 
封装 机 速度 

1.2 r/min 1. 3 r/min 1.2 r/min 1.3 r/min 

Ht 操作 者 B 6;5 5;4 16;14 13;14 
BMERA 7,5 65  16;17  16;15 

夜班 操作 者 B 8,6 7;5 15;14 17;14 
操作 者 A 5;4 4;3 15;13 13;14 











14.74 烧结 金属 的 研究 , 进行 一 项 试验 确定 烧结 时 


间 ( 两 水 平 ) 对 两 种 不 同 金属 抗 压 强度 的 影响 . 对 
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两 个 烧结 时 间 中 的 每 种 金属 烧结 5 个 测试 样品 , 数 抗 压强 度 抗 张强 度 
据 (klb/in ) 在 附 表 中 给 出 . 固化 时 间 固化 时 间 
7 天 28 天 7 天 28 天 
烧结 时 间 yi=847  y,210404 | y, =621 y, = 737 
100 min 200 min s, =820 5, =928 sı =48 8) = 55 
n, =50 n, =50 n, = 50 n, =50 
1 17.1 16.5 14.9 19.4 18.9 20.1 — — C 3 — 
资料 来 源 ; Aroni, S. , and Fletcher, G. “ Observations on 
15.2 16.7 17.2 20.7 mortar lining of steel pipelines. " Transportation. Engineering 
金属 Journal, Nov, 1979. 


2 123 13.8 10.8 15.6 17.2 16.7 
a. 考虑 抗 压强 度数 据 , 将 两 个 固化 时 间 看 作 处 理 ， 





11.6 12.1 16.1 18.3 求 所 有 n = 100 个 观测 值 的 总 和 ， 然后 求 CM, 
并 计算 SST. 
a. 对 数据 进行 方差 分 析 , 并 构造 方差 分 析 表 . b. 3& SSE. 
b. 烧结 时 间 和 金属 类 型 间 的 交互 作用 的 实际 意义 c. 求 SS( 总 ). 
是 什么 ? d. Xf a~e 中 的 结果 构造 方差 分 析 表 . 
c. 数据 是 否 提供 充分 的 证 据 表 明 烧 结 时 间 与 金属 e. 假定 研究 人 员 想 用 联系 平均 抗 压强 度 E(y) 与 
类 型 间 有 交互 作用 ?用 a 20.05 检验 . 7 ~28 天 时 间 区 间 内 固化 时 间 x 的 简单 线性 回归 
14.75 钢管 中 所 用 砂浆 的 强度 . Aroni 和 Fletcher 模型 来 估计 混合 砂浆 的 平均 抗 压强 度 , 解释 为 
(1979) 发 表 了 用 于 铺设 钢 制 水 管 管道 的 砂浆 抗 压 什么 最 小 二 乘 直线 通过 点 (7, y, ) 和 (28, y2). 


和 抗 张强 度 的 数据 . 他 们 注意 到 随 着 砂浆 固化 时 间 f. 求 最 小 二 乘 直线 . 

由 7 天 增加 到 28 R, 期 望 砂浆 强度 的 增加 . 基于 g. JH b 中 求 得 的 SSE 和 预测 方程 , 求 当 x = 20 天 
n=50 个 样品 的 样本 试验 的 抗 压 与 抗 张强 度 的 均值 时 , 平均 抗 压强 度 的 95% 置信 区 间 . 

和 标准 差 在 附 表 中 给 出 . h. 求 ,并 解释 该 值 . 


活动 中 的 统计 学 ; 暗 螂 的 痕迹 

昆虫 学 家 已 经 证 实 , 蚂 蚊 、 蜜 蜂 、 毛 虫 和 白蚁 这 些 昆 虫 用 化 学 或 气味 的 痕迹 导航 . 这 些 痕 迹 就 像 
食物 源 与 昆虫 巢穴 之 间 的 高 速 公 路 . 然而 , 直到 最 近 小 虫子 的 研究 人 员 相 信 蜂 螂 游 动 搜 寻 食物 的 导 
航行 为 是 随机 的 , 而 与 化 学 痕迹 无 关 . 

第 一 批 对 蜂 螂 的 随机 游 动 理论 提出 质疑 的 研究 人 员 之 一 是 弗吉尼亚 科技 大 学 的 环境 学 家 Dini 
Miller 教授 . 根据 Dini Miller 所 说 ,“ 蜂 螂 随机 游 动 意味 着 它们 必须 每 天 晚上 从 它们 隐藏 的 地 方 出 来 ， 
意外 地 碰 到 食物 和 水 , 但 是 蜂 螂 好 像 从 来 没有 挨 饿 . ”因为 以 前 从 来 没有 对 暗 螂 的 踪迹 跟踪 行为 进行 
评估 , 所 以 Miller 设计 了 一 个 试验 ,以 检验 暗 螂 沿 它 的 排泄 物 踪 迹 前 进 的 能 力 . ( Explore, Research at 
the University of Florida, 1998 年 秋 . ) 

首先 ，Miller 8 1: J iit 06928 rh Az SLT. —#h H BE a jy— - 称 为 信息 激素 , 她 从 理论 上 说 明 
信息 激素 是 蜂 螂 间 的 交流 手段 . 如 果 大 批 出 没 , B 4 周 有 大 量 的 排泄 物 , 那么 这 就 是 广告 ,“ 嘿 ,这 
是 蜂 螂 的 好 处 所 .“” 然 后 , 她 在 一 张 白色 层 析 纸 上 产 生 一 条 有 信息 激素 的 化 学 踪迹 , 将 纸 放置 在 一 个 
122 em? 大 小 的 Y 形 塑料 容器 的 底部 . 在 踪迹 起 始 处 , 将 德国 里 螂 放 人 容器 内 ,每 次 一 只 , 用 视频 监 
视 摄 影 机 来 监视 蜂 螂 的 运动 . 

除了 包含 凑 便 提取 物 (处 理 ) 的 踪迹 , 还 有 一 条 只 用 甲醇 产生 的 踪迹 , 第 二 条 踪迹 是 作为 控制 来 
比较 处 理 的 踪迹 . 因为 Miller 博士 也 想 确定 这 种 踪迹 追踪 能 力 是 否 因 不 同年 龄 、 性 别 、 繁 殖 状态 的 贬 
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ARE, 所 以 试验 中 用 4 AP230828: EERE, MEERE., MICI) 的 肉 性 、 晴 (未 成 熟 的 ). 每 
个 类 型 的 20 只 蜂 螂 随机 指派 到 处 理 踪 迹 , 每 个 类 型 的 10 只 随机 指派 到 控制 踪迹 , 因此 , 总 共 120 H 
蜂 螂 用 于 试验 . 试验 设计 的 安排 在 表 SIA14. 1 中 给 出 , 是 两 因子 一 一 踪迹 (提取 物 或 控制 ) 和 组 (雄性 
成 虫 、 崔 性 成 虫 、 剑 卵 的 雌性 或 晴 ) 的 析 因 设计 . 
表 SIA14.1 对 暗 螂 研究 的 实验 设计 的 安排 
AEAN 
雄性 成 虫 内 性 成 虫 怀胎 的 肉 性 5 
踪迹 提取 物 n=20 n=20 n=20 n=20 
控制 n=10 n=10 n=10 n=10 


将 试验 的 每 个 蛇 螂 的 运动 模式 通过 动态 动物 移动 分 析 ( DAMA) 程 序 变换 为 每 1/10 s fj (x, y) ^6 
标 . Miller 测量 了 每 个 (x, y) 坐标 与 踪迹 的 垂直 距离 ,然后 对 每 只 暗 螂 计算 这 些 距离 或 偏离 的 平均 
值 , 研究 中 120 只 蜂 螂 的 踪迹 偏离 ( 用 像素 度量 , 这 里 1 个 像素 近似 等 于 2 em) 存储 在 名 为 ROACH 
的 数据 文件 中 . 

昆虫 学 家 想 确定 不 同年 龄 - 性 别 组 中 的 暗 螂 在 追踪 提取 物 踪迹 或 控制 物 踪迹 中 的 能 力 是 否 有 差 
F. 换 句 话说 ,两 个 因子 一 一 年 龄 -性 别 组 和 踪迹 类 型 是 如 何 影响 丹 螂 的 平均 踪迹 偏离 的 ? 为 了 回 
答 这 个 问题 , 对 保存 在 ROACH 文件 中 的 数据 进行 双向 析 因 的 方差 分 析 ,， ANOVA 的 MINITAB 输出 在 
图 SIA14.1 中 给 出 . 














General Linear Model: Deviate versus Trail, Group 
Factor Type Levels Values 


Trail fixed 2 Control, Extract 
Group fixed 4 Female, Gravid, Male, Nymph 


Analysis of Variance for Deviate, using Adjusted SS for Tests 








Source DF Seq SS Àdj SS Àdj MS F P 
Trail 1  46445.5 46445.5 46445.5 063.34 0.000 
Group 3  16271.2 13000.6 4333.5 5.91 0.091 
Trail*Group 3 2245.2 2245.2 748.4 1.02 10.386 
Error 112  82131.7 82131.7 733.3 

"Total 119 147093.6 

S = 27.0799 . R-Sq = 44.165 X R-Sq(adj) = 40.67% 





图 SIA14.1 提取 物 踪迹 偏离 双向 ANOVA 的 MINITAB 输出 


首先 , 注意 到 检验 因子 交互 作用 的 p 值 (在 输出 中 着 重 显示 ) 为 0.386, 因此 , 没有 充分 的 证 据 
(在 a=0.05) 说 明 两 因子 间 存 在 交互 作用 . 这 表明 一 个 因子 (如 年 龄 - 性别 组 ) 对 平均 踪迹 偏离 的 影 
响 不 依赖 于 男 一 因子 (踪迹 类 型 ) 的 水 平 . 由 于 没有 交互 作用 的 证 据 , 所 以 对 两 个 因子 进行 主 效应 检 
验 是 恰当 的 . 

踪迹 和 组 的 主 效应 p 值 (都 在 输出 中 着 重 显示 ) 分 别 为 0. 000 和 0. 001. 因为 两 个 p 值 都 小 于 a = 
0.05,， 有 充分 的 证 据 : (1) 暴 螂 追踪 类 便 提取 物 踪 迹 和 控制 物 的 平均 偏离 是 有 差异 的 ; (2)4 个 年 龄 -性 
别 组 中 的 平均 偏离 有 差异 . 为 确定 哪 一 个 主 效应 平均 值 是 最 大 的 , 对 两 个 主 效应 进行 均值 的 多 重 比较 . 
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图 SIA14. 2 是 给 出 ( 顶部) 年龄 -性别 组 平均 值 的 鲍 费 罗 尼 排序 和 (底部 ) 踪 迹 类 型 平均 值 的 鲍 
费 罗 尼 排序 的 SAS 输出 . 两 个 比较 都 用 a = 0.05 的 试验 错误 率 . 根据 输出 顶部 给 出 的 “Bon Grouping" , 
年 龄 — PEXIZGOEXTMEL [8] ROME — i 3:2 Sh Et LAE ME MERI MS ZR DURER. 成 年 雄性 比 怀胎 的 有 显著 地 较 小 
的 平均 踪迹 偏离 ,其 他 年 龄 - 性 别 组 均值 对 没有 显著 差异 . 图 SIA14.2 HERRA th CMS pz 26 E RCRUM] 
踪迹 的 平均 偏离 显著 地 小 于 暗 螂 追踪 控制 的 平均 . 








Bonferroni (Dunn) t Tests for DEVIATE 


NOTE: This test controls the Type | exper imentwise error rate, but it generally has a higher 
Type |! error rate than REGNQ . 


filpha 0.05 


Error Degrees of Freedom 112 
Error Mean Square 733.3187 
Critical Value of t 2.68593 
Minimun Significant Difference 18.78 


Means with the same letter are not significantly different. 


Bon Group ing Hean N GROUP 
ñ 53.747 30 Gravid 

B ñ 37.077 30 Nymph 
B ñ 35.110 30 Female 

B 20.917 30 Male 


Bonferroni (Dunn) t Tests for DEVIATE 


NOTE: This test controls the Type | experimentwise error rate, but it generally has a higher 
Type |! error rate than RESMNQ . 


lpha 0.05 
Error Degrees of Freedom 112 
Error Mean Square 733.3187 
Critical Value of t 1.98137 
Minimum Signif icant Difference 10.39 


Harmonic Mean of Cell Sizes — 53.33333 


NOTE: Cell sizes are not equal. 


Means with the same letter are not significantly different. 


Bon Group ing Mean N TRñ IL 
ñ 64.535 40 Control 
B 22.801 80 Extract 





图 SIA14.2 组 平均 和 踪迹 平均 的 SAS 鲍 费 罗 尼 排序 


昆虫 学 家 的 最 终结 论 如 下 ， 有 证 据 表明 蜂 螂 表现 出 追踪 粪便 提取 物 踪迹 的 能 力 胜 于 控制 ( 甲 
醇 ), ME, 成 年 雄性 表现 出 比 怀胎 (怀孕 的 内 性 ) 峡 螂 更 强 的 追踪 踪迹 的 能 力 . 





== é ` 
第 15 章 ， 非 参数 统计 
目标 介绍 一 些 比 第 8 章 及 第 10 ~ 14 章 的 方法 要 求 更 少 ， 或 严格 性 更 低 的 假定 的 统计 检验 . 


15.1 引言 : 分 布 自由 检验 


前 几 章 介绍 的 置信 区 间 和 检验 过 程 都 涉及 总 体 参数 的 推断 ， 所以， 常 称 它们 为 参数 统计 检验 . 
这 些 参数 方法 中 许多 (例如 , 第 8 章 的 小 样本 了 检验 或 者 第 14 $688 ANOVA F 检验 ) 依赖 于 数据 是 来 
自 正 态 分 布 总 体 抽样 的 假定 . 当 数据 是 正 态 时 ， 这 些 检 验 是 最 大 功效 检验 , 即 利 用 这 些 参 数 检 验 使 
得 功效 (研究 人 员 正 确 地 拒绝 原 假设 的 概率 ) 最 大 化 . 

考虑 肯定 是 非 正 态 的 数据 总 体 . 例如 ,分 布 可 能 是 非常 平坦 、 尖峰 或 者 明显 的 右 偏 或 左 偏 ( 见 图 
I5. 1). 对 这 样 的 数据 集 利用 小 样本 了 检验 可 能 会 导致 严重 的 后 果 ， 因为 正 态 性 假定 明显 背离 ,7 检 
验 是 不 可 靠 的 : (1) D 型 错误 ( 即 H, WAN, APAT) 的 概率 可 能 大 于 选取 的 o 值 ; (2) 检验 的 功 
效 1-B, 并 没有 达到 最 大 . 


À A 











a) 平坦 分 布 b) 尖峰 分 布 ç) 有 偏 分 布 
图 15.1 :统计 量 不 适用 的 一 些 非 正 态 分 布 


许多 非 参 数 技术 适用 于 分 析 不 服从 正 态 分 布 的 数据 ， 非 参 数 检验 不 依赖 被 抽样 总 体 的 分 布 ， 于 
A. 称 它们 为 分 布 自 由 检验 . 而 且 ， 非 参数 检验 着 重 于 总 体 概率 分 布 的 位 置 ， 而 不 是 总 体 的 特定 参 
数 , 如 均值 (所 以 称 为 “ 非 参数 ”). 

定义 15. 1 分 布 自由 检验 是 一 种 不 依赖 于 被 抽样 总 体 概率 分 布 的 任何 基础 假定 的 统计 检验 . 

定义 15.2 致力 于 分 布 自由 检验 的 推断 统计 学 分 支 称 为 非 参 数 的 . 

非 参数 检验 也 适用 于 数据 本 质 上 是 非 数值 ， 但 可 以 进行 排序 的 情况 S. 例如 , 进行 口味 测试 或 其 
他 消费 品评 估 时 ,可 以 说 我 们 认为 产品 A 比 产品 B 好 , B W; C 好 , 但 是 不 能 得 到 各 自 度量 的 精确 定 
BUE. 基于 测量 值 的 秩 的 非 参数 检验 称 为 秩 检 验 . 

定义 15. 3 基于 测量 值 的 秩 的 非 参 数 统计 量 (或 检验 ) 称 为 秩 统 计量 ( 或 秩 检验 )， 

在 本 章 中 , 介绍 一 些 有 用 的 非 参 数 方法 ， 记 住 在 数据 是 非 正 态 或 排序 的 情形 下 , 这些 非 参 数 检 
验 比 相应 的 参数 检验 有 更 大 功效 . 





@ 可 以 根据 度量 的 大 小 排序 的 定性 数据 称 为 有 序数 据 . 
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Tr 15. 2-35, 我 们 介绍 一 种 推断 单个 总 体 中 心 趋势 的 检验 ; 在 15.3 节 和 15.5 5, 利用 独立 样本 ` 
给 出 比较 两 个 或 多 个 概率 分 布 的 秩 统 计量 ; 在 15. 4 节 和 15. 6 节 中 , 利用 配对 和 随机 化 区 组 设计 进行 
总 体 的 非 参 数 比较 ; 最 后 , 在 15.7 节 中 , 介绍 两 个 变量 间 相 关 性 的 非 参 数 度量 . 


15.2 检验 单个 总 体 的 位 置 


回忆 8. 5 节 , 检验 关于 一 个 总 体 均 值 假设 的 小 样本 过 程 要 求 总 体 有 近似 正 态 分 布 . 当 我 们 从 一 
个 肯定 是 非 正 态 总 体 (例如 , 图 15. 1 所 示 的 某 个 总 体 ) 抽 取 一 个 小 样本 时 ， T 检 验 是 无 效 的 , 我 们 必 
须 求助 非 参 数 过 程 , 适用 于 这 种 情形 的 最 简单 非 参 数 技术 是 符号 检验 . 符号 检验 专门 用 于 检验 任 一 
连续 总 体 中 位 数 的 假设 , 与 均值 一 样 , 中 位 数 是 分 布 中 心 或 位 置 的 度量 ; 因此 ， 符号 检验 有 时 也 称 为 
位 置 检验 . 

设 y1,y2,…,y。 是 来 自 中 位 数 > 未 知 的 总 体 的 一 个 随机 样本 ， 假定 要 检验 原 假 设 Ho: + = 

100, 对 单 侧 备 择 假设 H.,: 7 > 100. 由 定义 2.6 知 ， 中 位 数 是 这 样 的 一 个 数 , 使 得 概率 分 布下 的 
一 半 面 积 位 于 7 的 左 部 而 另 一 半 面 积 位 于 7 的 右 部 fo» 
〈《 见 图 15.2). 所 以 , 从 总 体 中 选取 的 一 个 y 值 大 于 7 ! 
的 概率 是 0.5, B P(y;» 7) 20.5. 事实 上 , 如 果 原 假 
设 成 立 , 可 以 期 望 观测 到 大 约 一 半 的 样本 y 值 大 于 7 = 
100. 








符号 检验 利用 检验 统计 量 S, 其 中 S = y, 中 超过 


» y 





100 的 个 数 . 注意 S 仅 依赖 于 每 个 样本 值 y, 与 100 493 中 位 数 
的 符号 ( 正 或 负 ) , 即 我 们 简单 地 计算 样本 差 (y, - 100) 图 15.2 总 体 中 位 数 7 的 位 置 


中 正 号 ( + ) 的 个 数 . 如 果 S KK” 即 如 果 我 们 观测 到 
了 不 同 寻常 多 个 超过 100), 则 我 们 拒绝 Ho, 而 支持 备 择 假设 H: 7 > 100. 

下 面 给 出 符号 检验 的 拒绝 域 . 设 每 个 样本 差 (y; - 100) 代 表 由 次 独立 试验 组 成 的 试验 中 单个 斌 
PHAR, 如 果 我 们 将 正 差 表 示 “ 成 功 ”, 负 差 表示 “失败 ”, M| S 是 次 试验 中 成 功 的 次 数 . 在 所 
F, 任 一 次 试验 观测 到 成 功 的 概率 是 ， 

p=P( 成 功 ) - P(y; -100 >0) =P(y; >100) =0.5 

因为 试验 是 独立 的 , 所 以 满足 第 4 章 给 出 的 二 项 试验 的 性 质 ,从 而 ,5 服从 参数 为 4 和 p= 
0. 5 的 二 项 分 布 . 可 以 利用 这 个 事实 计算 符号 检验 的 观测 显著 性 水 平 (p 值 ), 如 下 面 例 题 所 示 . 
细菌 是 污水 处 理 厂 的 微生物 生态 系统 中 最 重要 的 组 成 部 分 . 水 资源 管理 工程 师 认为 在 
茶 个 指定 工厂 收集 的 污水 样本 中 活性 细菌 的 百分数 服从 中 位 数 为 40% 的 分 布 , 如 果 中 位 百分数 
大 于 40, 则 应 该 调整 污水 处 理 过 程 . 表 15.1 给 出 了 含有 10 个 污水 样品 的 随机 样本 中 活性 细菌 的 
百分数 . 

数据 提供 了 充分 证 据 表明 污水 样品 中 活性 细菌 的 中 位 百分数 大 于 40 吗 ? 利用 a =0.05 
检验 . 


解 ” 我 们 要 检验 表 15.1 活性 细菌 百分数 
a OO a A 
Ho: 7-40 41 33 43 52 46 
H, TD 40 37 44 49 53 30 





利用 符号 检验 , 检验 统计 量 是 ， 
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$= 样本 中 超过 40 的 yi 个 数 =7 
“其 中 5S 服从 参数 为 n=10 和 p=0.5 的 二 项 分 布 . 

由 定义 8.4, 检验 的 观测 显著 性 水 平 (p 值 ) 是 我 们 观测 到 的 检验 统计 量 S 值 至 少 如 计算 值 那 样 
与 原 假设 相 矛 盾 的 概率 . 对 于 单 侧 情 形 , p 值 是 我 们 观测 到 一 个 检验 统计 量 值 大 于 等 于 $=7 的 概率 . 
当 n=10, p=0.5 BF, 由 表 B.2 的 累积 二 项 表 得 到 这 个 概率 . 如 果 * 服从 n=10, p=0.5 的 二 项 分 布 ， 
则 检验 的 p 值 是 : 

p 值 = P(x 宇 $S) =P(x>7) =1 -P(x<6) =1 -0.828 =0. 172 

图 15. 3 的 MINITAB 输出 给 出 了 观测 的 显著 性 水 平 (阴影 部 分 ). 因为 p 值 0.1719 大 于 wa = 
0.05, 所 以 我 们 不 能 拒绝 原 假 设 , 即 没 有 充分 证 据 表 明 在 污水 样本 中 活性 细菌 的 中 位 百分数 大 
于 40. 








Sign Test for Median: ACTBAC 


Sign test of median = 40.00 versus > 40.00 
N Below Equal Above "^ P Median 
ÀCTBAC 10 3 D 7 0.1719 43.50 





图 15.3 4515.1 的 MINITAB 符号 检验 


单 侧 和 双 侧 备 择 假 设 的 符号 检验 汇总 在 下 面 框 格 中 . 





总 体 中 位 数 7 的 符号 检验 
单 侧 检验 双 侧 检验 
Ho: r= 7 H: r= 
H: T> R, H.: z < ] H.: TÉT 
检验 统计 量 : 检验 统计 量 ， 
S= 样本 观测 值 中 大 于 ro 的 个 数 S=S, 5 S, 中 大 者 
[或 $= 样 本 观测 值 中 小 于 ro 的 个 数 . ] 其 中 : 





S, = 样本 观测 值 中 大 于 ro 的 个 数 
S, = 样本 观测 值 中 小 于 ro 的 个 数 
[ 注 : 从 分 析 中 删 去 恰好 等 于 假设 的 中 位 数 ro 的 观测 值 ,并 相应 地 减 小 样本 大 小 . ] 
观测 的 显著 性 水 平 : 观测 的 显著 性 水 平 : 
p š = P(x> S) p Ë =2P(x>2 S) 
rE x KAA 32 n 和 p=0.5 的 二 项 分 布 . 
拒绝 域 : 如 果 a>p 值 , Ef H. 
假定 : 样本 是 从 连续 概率 分 布 中 随机 抽取 的 . ( 注 : 无 须 对 概率 分 布 的 形状 作假 定 . ) 


























对 于 双 侧 检验 , 可 以 运用 下 面 任 一 种 方法 计算 检验 统计 量 ; 
S, = 大 于 ro 的 y 的 个 数 =n 次 试验 中 成 功 的 次 数 


S; = 小 于 ro 的 yi; 的 个 数 =n 次 试验 中 失败 的 次 数 
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注意 51 +S, =n; 所 以 ,9 2n -3 在 任 一 情形 下 , 检验 的 p 值 是 相应 单 侧 p 值 的 2 倍 , 为 简化 过 程 ， 
我 们 建议 使 用 S, 与 S, 中 较 大 者 作为 检验 统计 量 并 计算 p 值 . 

”回忆 6. 10 55, 对 充分 大 的 , HE np, o = Vnpg 的 正 态 分 布 可 以 用 来 近似 二 项 分 布 . 当 p = 
0.5 时 ,即使 很 小 , 仅 为 10, 近似 正 态 性 仍然 合理 ( 见 例 6. 23). 于 是 ， 当 nz 10 RE, 可 以 利用 第 8 
章 熟 悉 的 标准 正 态 Z 统计 量 进行 符号 检验 . 这 种 大 样本 符号 检验 汇总 在 下 面 框 格 中 . 复习 第 8 章 作 





为 如 何 运 用 此 检验 的 例子 . 
基于 大 样本 (n 宇 10) 的 符号 检验 
单 侧 检 验 双 侧 检验 
Hi: T = 7 Hy: T=To 
H 7>T0[ 或 , H .: r<] H : r To 


$ —0.5n .S-0.5n 





检验 统计 量 ; z-EO) 





[ 注 : S 值 如 前 一 框 格 所 示 那 样 计 算 . ] 

















VS)  V(65)(05)n 0.5/n 








kama, 拒绝 域 : 
Z»z, Z»z4 
其 中 表 B.5 给 出 了 Z, 5 Zn 的 值 . 
(8) 应 用 练习 JH a -0.05. ) 


15.1. 星巴克 咖啡 中 的 咖啡 因 含量 . 佛罗里达 大 学 
药学 院 的 科学 家 调查 了 一 杯 16 ej) E PS x n 
啡 中 咖啡 因 水 平 (Journal of Analytical Toxicology, 
2003 年 10 H). 试验 的 一 个 阶段 是 连续 6 天 从 一 
个 指定 的 咖啡 专卖 店 购买 性 巴克 早餐 拼 配 (一 种 
拉美 咖啡 混合 物 ) , 表格 中 提供 了 6 杯 咖啡 中 咖啡 
因 的 含量 (mg). 


564 498 259 303 300 307 








a. 假定 科学 家 想 要 判断 早餐 拼 配 咖啡 中 咖啡 因 含 
量 的 中 位 数 是 否 超过 300 mg, 建立 原 假设 和 感 
兴趣 的 备 择 假设 . 

b. 样本 中 有 多 少 杯 咖 啡 因 含量 超过 300 mg? 

c. 假定 p =0.5, 利用 附录 B 的 累积 二 项 表 , 计算 6 标 
中 至 少 有 4 杯 咖啡 因 含 量 超过 300 mg 的 概率 . 

d. 基于 c 中 的 概率 , 对 H, MH, 作 什么 推论 ? CR 


15.2 放射 性 地 衣 . 参考 练习 2. 11, 监测 地 衣 辐射 水 
平 的 2003 年 地 衣 放 射 性 核 基准 研究 项 目 . 阿拉 斯 
加 大 学 研究 人 员 收 集 9 种 地 衣 样 品 并 测量 每 种 样 
品 中 放射 性 元 素 饮 - 137 的 含量 (单位 pCi/L). 
( 表 中 给 出 了 存储 于 LICHEN 文件 中 数据 的 自然 对 
数 . ) 假定 想 要 检验 地 衣 中 匈 含 量 的 中 位 数 是 否 为 
7=0.003pCiAmL. 利用 附 表 (下 页 ) 的 MINITAB 输 
出 进行 非 参数 检验 a =0. 10. 








地 点 
Bethel -5.50 -5.00 
Eagle Summit -4.15 -4.85 
Moose Pass -6.05 
Turnagain Pass -5. 00 
Wickersham Dome -4.10 -4.50 -4. 60 


—— —  _ — 
资料 来 源 ;Lichen Radionuclide Baseline Research project ,2003. 





Sign Test for Median: CESIUM 


Sign test of median = 0.00300 versus not = 0.00300 
N Below Equal Above P Median 
CESIUM 9 1 0 8 0.0391 0.00783 





练习 15.2 的 MINITAB 输出 


非 参 数 统 计 
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15.3 管道 表面 粗糙 度 . 参考 练习 8.16, Anti-corro- 
sion Methods and Materials ( Vol. 50, 2003) 中 关于 油 
田 使 用 的 内 管道 涂 层 表面 粗糙 度 的 研究 , 表 中 给 出 
T 20 个 管道 样本 数据 (mm). 构造 非 参 数 检验 判断 
管道 内 涂 层 表面 粗糙 度 的 中 位 数 > 是 否 等 于 2 mm. 
利用 a 20.05 检验 . 


1.72 2.50 2.16 2.13 1.06 2.24 2.31 2.03 1.09 1.40 
2.57 2.64 1.26 2.05 1.19 2.13 1.27 1.51 2.41 1.95 





资料 来 源 :Farshad, F. , and Pesacreta, T. “Coated pipe interior 
surface roughness as measured by three scanning probe instru- 
ments. ” Anti-corrosion Methods and Materials, Vol. 50, No. 1, 
2003 ( EIL). 


15.4 和 白 是 的 质量 . 在 The American Statistician ( 2001 
年 5 H) n, 用 非 参 数 符号 检验 分 析 了 白 虾 质量 
的 数据 . 虾 质量 的 一 种 度量 是 黏 结 性 , 因为 新 捕 
捞 的 是 通常 冰冻 储存 ,担心 在 储存 之 后 粘 结 性 
会 变 弱 . 对 一 个 20 只 新 捕捞 的 白 虾 样本 , 分别 
在 储存 前 和 冰冻 储存 两 周 后 测量 其 粘 结 性 , 得 到 
每 只 虾 烙 结 性 度量 之 差 ( 冰 冻 前 减 冰冻 后 ). 如 
果 储 存 对 粘 结 性 没有 影响 , 则 差 的 总 体 中 位 数 
等 于 0; 如 果 粘 结 性 在 储存 后 变 弱 , 则 差 的 总 体 
中 位 数 为 正 值 . 

a. 构造 原 假设 和 备 择 假设 检验 储存 之 后 粘 结 性 是 
否 变 弱 . 

b. 在 20 只 是 的 样本 中 , 有 13 个 正 值 差 , 利用 这 个 
值 求 检验 的 p 值 . 

c. 如 果 a =0.05, 给 出 合理 的 结论 (用 本 问题 的 语 
BH). 

15.5 汽车 尾气 中 氨 气 的 含量 . 参考 练习 2. 24 Envi- 
ronmental Science & Technology(2000 年 9 月 1 日 ) 中 
关于 旧金山 高 速 公 路 隧道 出 口 臣 道 处 附近 氨 气 水 
平 的 研究 . 表 中 的 数据 表示 随机 抽取 8 天 , 每 天 下 
午 高 峰 时 期 氨 的 浓度 ( 百 万 分 之 一 ). 假定 你 想 判 断 
所 有 下 午 高 峰 时 期 氨 的 浓度 中 位 数 是 否 超过 百 万 
分 之 1.5. 


1.53 1.50 1.37 1.51 1.55 1.42 L41 1.48 


a 构造 此 检验 的 原 假 设 和 备 择 假 设 . 
b. 计算 检验 统计 量 的 值 . 
c. 计算 检验 的 P fü. 
d， 如 果 a 20.05, 给 出 合理 的 结论 (用 本 问题 的 语言 ). 
15.6 解决 数学 规划 . HE Transactions (1990 年 6 月 ) 
介绍 了 一 种 解决 多 项 式 0 - 1 数学 规划 的 混合 算 


法 , 算法 将 伪 布 尔 概念 和 计时 验证 隐 数 法 过 程 相 
结合 . 用 混合 算法 解决 了 25 个 随机 问题 ; 求解 
的 时 间 ( 以 秒 计 的 CPU 时 间 ) 如 下 表 所 示 . 构造 
检验 判断 是 否 有 一 半 以 上 的 随机 多 项 式 0 - 1 数 
学 规划 需要 1 CPU 秒 或 更 短 求解 时 间 , 用 a = 
0.01 检验 . : 


0.045 1.055 0.136 1. 894 0.379 
0.136 0.336 0.258 1.070 0. 506 
0. 088 0.242 1. 639 0. 912 0.412 
0. 361 8. 788 0. 579 1. 267 0. 567 
0.182 0. 036 0. 394 0. 209 0. 445 


资料 来 源 : Snyder, W. S. , and Chrissis, J. W. “A hybrid 
algorithm for solving zero-one mathematical programming prob- 
lems. ” HE Transaction, Vol. 22, No. 2, June 1990, p. 166 
GR I). 


15.7 土壤 中 的 镭 . 参考 练习 8.20, Florida Scientist 
(1991 年 夏 / 秋 ) 关 于 土壤 中 镭 -226 的 研究 . 表 中 
数据 表示 在 代 德 县 南部 收集 的 26 种 土壤 样品 中 
fli -226 水 平 (以 pCi/L BERE) , 利用 非 参 数 符号 检 
验 判 断代 德 县 南部 土壤 中 镭 -226 含量 的 中 位 数 
是 否 超 过 环境 保护 署 的 限制 4.0pCi/L, 用 w =0. 10 
检验 . 


1.46 0.58 4.31 1.02 0.17 2.92 0.91 0.43 0.91 
1.30 8.24 3.51 6.87 1.43 1.44 4.49 421 1.84 
5.92 1.86 1.41 1.70 2.02 1.65 1.40 0.75 
资料 来 源 ; Moore, H. E. , and Gussow, D. G. “Radium and 


radon in Dade County ground water and soil samples. " Florida 
Scientist, Vol. 54, No. 3/4, Summer/ Autumn, 1991, p. 155 
(3 的 一 部 分 ). 


15.8 LESARAR. 在 动物 学 中 , 鱼 类 过 分 地 从 
一 个 固定 区 域 移 到 另 一 个 区 域 的 现象 称 为 过 分 暂时 
性 迁徙 (ETM). 为 了 调查 孔 淮 鱼 群体 中 的 ETM, 将 
40 条 成 年 肉 性 孔雀 鱼 放 人 一 个 试验 用 的 养 鱼 槽 的 左 
分 隔 间 中 , 槽 被 玻璃 板 分 成 两 半 . 移 走 玻璃 板 之 后 ， 
在 30 min 内 的 每 分 钟 都 记录 由 左 半 部 分 通过 中 线 移 
入 右 半 部 分 以 及 反 过 来 由 右 半 部 分 移 人 左 半 部 分 的 
鱼 的 数目 ( Zoological Science, Vol. 6, 1989. ). 如 果 达 
到 平衡 , 研究 人 员 期 望 留 在 左 半 部 分 鱼 数 的 中 位 数 
为 20. 下 面 给 出 了 30 次 观测 的 数据 ( 即 在 每 分 钟 结 
束 时 左 半 部 分 鱼 的 数目 ). 利用 大 样本 符号 检验 判 
断 中 位 数 是 否 小 于 20, 用 a =0.05 检验 . 
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有 充分 证 据 表 明 在 这 个 批 中 有 人 少 于 一 半 的 水 泥 样 
本 其 粗糙 颗粒 的 含量 大 于 2% 吗 ? 用 a = 0.05 
资料 来 源 : Terami, H. , and Watanabe, M. “Excessive tran- 
sitory migration of guppy populations, lll. Analysis of percep- 理论 练习 
tion of swimming space and a mirror effect. ”Zoological Sci- 15.10 ”利用 符号 检验 来 检验 Hy: =+ Xt H, TÉT, 


ence, Vol. 6, 1989. p. 977, (| 2). 其 中 ， 
15.9 水 泥 中 粗糙 的 颗粒 . 某 些 呈 粉 状 或 颗粒 状 产品 S, = 样本 观测 值 中 大 于 n 的 个 数 
的 一 个 重要 性 质 是 它们 的 微粒 大 小 分 布 . 例如 , 过 S, = 样本 观测 值 中 小 于 r 的 个 数 


高 的 粗糙 颗粒 比例 严重 地 影响 耐火 水 泥 , 是 由 低劣 证 明 :P(S >c) =P(S, <n - c) ,其 中 0<een 
包装 带 来 的 缺点 . 下 面 的 数据 摘自 Journal of Quality — 45.41 参考 练习 15. 10 的 双 侧 检验 . 利用 那个 练习 


Technology(1985 年 7 H), 表示 来 自 一 个 大 的 批量 。 的 结果 证 明 此 检验 的 观测 显著 水 平 为 : 
中 8 个 耐火 水 泥 样品 的 随机 样本 粗糙 颗粒 百分比 : pt =2P(S, =c) 


17 09 3.4 25 31 06 1.0 2.1 


15.3 比较 两 个 总 体 : 独立 随机 样本 


假定 两 个 独立 随机 样本 用 于 比较 两 个 总 体 , HAB 8 章 的 了 检验 不 适 于 进行 这 种 比较 . 我 们 不 愿 
意 对 基础 的 概率 分 布 形 式 进行 假定 , 或 者 不 能 获得 样本 测量 值 的 精确 值 . 在 上 述 情形 下 , 如 果 数 据 
可 以 排序 , 可 以 利用 一 种 检验 来 比较 两 个 总 体 的 中 位 数 . 但 是 , 更 为 有 效 的 非 参 数 检验 是 比较 整个 
概率 分 布 而 不 仅仅 是 中 位 数 , 这 种 检验 称 为 威 尔 科 克 森 秩 和 检验 , 原 假设 是 与 两 个 总 体 关联 的 概率 
AV RISE, 备 择 假设 是 一 个 总 体 的 概率 分 布 位 于 另 一 个 的 右边 (或 左边 ). 

例如 , 假定 进行 一 项 试验 , 这 两 组 人 为 :必须 使 用 软件 包 的 文字 处 理 操作 员 和 开发 计算 机 软件 的 
电脑 程序 专家 比较 两 组 人 编写 的 软件 包 的 等 级 , 试验 选取 m =7 名 文字 处 理 操作 员 和 n, 27 名 程 
序 专家 构成 独立 随机 样本 , 要 求 每 个 人 按 从 1 ~ 100 的 标 度 为 软件 包 定 级 , 100 代表 最 佳 等 级 . 记录 数 
据 之 后 , 根据 值 的 大 小 将 14 个 等 级 排 秩 , 1 代表 最 小 等 级 , 14 代表 最 大 等 级 相同 等 级 观测 值 ( 如 果 
存在 ) 的 秩 等 于 这 些 同 级 观测 值 秩 的 平均 值 . 例如 , 如果 等 级 为 第 二 和 第 三 的 观测 值 是 相等 的 , 则 指 
派 每 一 个 的 秩 为 2. 5. 表 15. 2 是 试验 数据 及 它们 的 秩 . 

威 尔 科 克 森 秩 和 检验 基于 两 个 样本 秩 的 和 ( 称 为 秩 和 ). 








逻辑 是 如 果 原 假设 : 表 15. 2 编写 软件 包 的 等 级 
Hy; 两 个 总 体 概 率 分 布 相同 文字 处 理 操作 员 编程 专家 
为 真 , n=n +n, 个 观测 值 任 一 评级 的 可 能 性 与 其 他 评 “等 级 秩 | 等 级 秩 
级 是 一 样 的 . 从 而 , 对 于 相同 的 样本 大 小 , AARAA T, » . » 5 
和 T, 是 几乎 相等 . » 5 40 ç 
相反 ,如 果 单 侧 备 择 假设 : 55 9 90 13 
H,: 总 体 1 的 概率 分 布 移动 到 总 体 2 的 右边 10 ' 65 T 
为 真 , 则 对 于 相同 的 样本 大 小 , 可 以 期 望 秩 和 T, 大 于 秩 和 30 4 85 12 
T, 事实 上 ,可 以 证 明 ( 证 明 略 ) 不 管 样本 大 小 mm n, 都 有 2 2 25 14 
n(n+1) m =7 T, =32 | m-7 T,=73 





T, +T, = 
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这 里 n=m +m. 所 以 , 35 T, 变 小 时 , T 将 会 变 大 , 4 T, 值 大 时 , 拒绝 H, 接受 及 . 独立 随机 样本 的 
威 尔 科 克 森 秩 和 检验 的 汇总 见 下 面 的 框 格 . 





总 体位 置 移动 的 威 尔 科 克 森 秩 和 检验 ; 独立 随机 样本 @ 





单 侧 检验 双 侧 检验 
H: D, # D, 相同 H,: D, # D, 相同 
H,: D, 移 位 于 D, 的 右边 c H,: D, 移 位 于 D, tici d ean 


(X H,: D, ØF D, 的 左边 ) 


将 两 个 样本 的 n, +n, 个 观测 值 从 小 ( 秩 1) 到 大 ( 秩 n, +m) HE, 计算 分 别 与 样本 1 和 样本 2 关联 的 秩 
fo T, 与 7 然后 计算 检验 统计 量 . 


检验 统计 量 ， 检验 统计 量 ， 

T,, 如果 mm «n; Ti, Bu n, «n; 

T,, in nj <n. T,, in X n, «n. 

(JE n; =m, 可 以 用 任 一 个 秩 和 . ) (RE n, 2m, 可 以 用 任 一 个 秩 和 . ) 用 全 代 
表 这 个 秩 和 . 

拒绝 域 : 拒绝 域 : 

T: TST; TST] TST, Š T> T, 


T,: T,sT,[ X T,zT,] 
EX Ë T, 和 Ty do B. 15 得 到 . 
注 ; 指派 给 相等 观测 值 的 秩 等 于 指派 给 这 些 观 测 什 不 相等 时 的 秩 的 平均 信 . 

















我 们 将 在 例 15.3 中 介绍 对 于 指定 的 a, 求 拒绝 域 的 步骤 . 首先 ， 利用 表 B. 15 和 计算 机 输出 提供 
的 拒绝 域 ,比较 表 15. 2 给 出 的 程序 员 和 文字 处 理 操作 员 的 等 级 . 
参考 表 15.2 中 的 数据 . . 

a. 利用 表 B. 15 检验 操作 员 和 程序 员 的 等 级 概率 分 布 是 相同 的 原 假设 对 其 中 一 个 分 布 移动 到 另 

一 个 右边 的 备 择 假设 . 用 a = 0. 05 检验 . 

b. 确定 检验 的 p (B, 并 解释 结果 . 

解 

a. 可 以 用 秩 和 作为 这 个 双 侧 检验 的 检验 统计 量 , d RUBRI T 非常 小 或 非常 大 , 即 如 果 7| < T, sË 
Ti=Tu, 我们 拒绝 Ho. T, I To 的 制 表 值 ， 即 秩 和 分 布 的 下 尾 和 上 尾 值 , 见 表 B. 15 对 a =0. 025 的 
单 侧 检验 及 a = 0. 05 的 双 侧 检验 的 临界 值 在 表 B. 15a 给 出 , 表 15.3 是 表 B. 15a 的 部 分 复制 . 表 
B. 15b 给 出 a =0. 05 的 单 侧 检验 和 o = 0. 10 的 双 侧 检验 的 临界 什 Ty A Tu. 观察 表 15. 3, 会 找到 对 应 








O 基于 独立 随机 样本 的 用 于 比较 两 个 总 体 的 另 一 个 统计 量 是 曼 - 惠 特 尼 U 统计 量 ，U 统计 量 是 秩 和 的 简单 函数 ,可 
以 证 明 威 尔 科 克 森 秩 和 检验 和 曼 - 惠 特 尼 U 检验 是 等 价 的 . 
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Tn =m =7 和 Ti=37, Ty =68 的 临界 值 (阴影 部 分 ). 所 以 , 对 于 a =0. 05, 我 们 拒绝 Hy, 如 果 
Ti <37 或 T, >68 
因为 检验 统计 量 的 观测 值 mn =32( 在 表 15.2 计算 ) 小 于 37, 所 以 拒绝 等 级 分 布 相同 的 假设 , 有 
充分 的 证 据 表明 一 个 分 布 移动 到 另 一 个 分 布 的 右边 . 
i 3815.3 表 B. 15 的 部 分 复制 





























T, T. T, T, T, T, T, £s T, T, T, T, T 
3 5 16 6 18 6 21 7 23 7 26 8 28 8 31 
4 6 18 11 25 2 2 | 2 3 13 35 14 38 | 15 4 
5 6 21 2 28 | 18 3 | 19 1 20 45 | 210 49 | 22 53 
6 7 23 12 — 32 19 4 26 52 | 28 56 | 29 a 3 65 
" 7 26 l 3 | 20 5 |28 5 [O 65 so 735 | 4 z 
8 8 28 14 — 38 | 21 49 | 29 6 39 B | 49 d 8 | sl 9 
9 8 31 I5 4l 22 53 | 31 6 | 4 78 | 51 93 | 63 108 
10 9 33 l — 44 | 24 36 | 32 30 | dà 8 | s4 9 |6 114 





b. 图 15. 4 给 出 了 相等 性 分 析 的 SPSS 输出 ， 威 尔 科 克 森 秩 和 检验 的 两 个 秩 和 及 双 侧 观测 的 显著 
性 水 平 (p 值 ) 都 在 输出 中 阴影 部 分 . 因为 值 0. 009 小 于 =0.05， 所 以 我 们 得 到 与 a 同样 的 结论 , 即 
拒绝 Ho, 因此 概率 分 布 有 不 同 的 位 置 . 


Test Statisticsh 


Ranks 


Sum of 
USERGRP N Mean Rank Ranks 
P 7 
7 
a. Not corrected for ties 


RATING W 4.57 32.00 
PROG 10.43 73.00 
Total 
b. Grouping Variable: USERGRP 


14 
图 15.4 5| 15.2 的 SPSS 威 尔 科 克 森 秩 和 检验 


假定 例 15.2 中 的 备 择 假设 是 单 侧 检验 . 例如 假定 要 检验 p, 对 备 择 假设 
H,: 分 布 2 移动 到 分 布 1 的 右边 

给 出 用 a = 0. 025 的 检验 拒绝 域 . 

解 我 们 可 以 用 T, 或 者 T, 作为 检验 统计 量 ; 较 小 的 T, 和 较 大 的 T, 支持 备 择 假设 如 果 我 们 
H T, 作为 检验 统计 基 , MRTT, 则 拒绝 Ho, 这 里 T, 表示 由 表 15.3 给 出 的 秩 和 下 尾 值 ， 当 n = 
n, =7 时, 它 的 值 为 37.0, 所 以 , a =0. 025 时 , 单 侧 检 验 的 拒绝 域 是 T, <37. 

如 果 选 取 T, 作为 检验 统计 量 , 4 T, 大 , BB T, >T 时 ,拒绝 HS, To 的 值 由 表 15.3 AB, 
n, =m =7BF, Ty 268.0, 这 两 个 检验 是 等 价 的 . 
BIE ni =m =4 的 威 尔 科 克 森 秩 和 检验 , 确定 T, 的 值 , 使 得 PCT, <T,) =0.05. T, 的 这 
个 值 对 于 a = 0. 05 的 单 侧 检验 是 合适 的 . 


Mann-Whitney U 
Wilcoxon W 

Z 

Asymp. Sig. (2-tailed) 
Exact Sig. [2*(1-tailed 
Sig.)] 
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解 ” 为 了 解决 这 个 问题 , 利用 第 3 章 的 概率 方法 . 如 果 Ho 成 立 ( 即 如 果 两 个 总 体 概率 分 布 相 
Fi), 则 n, + ns =8 个 观测 值 的 任 一 评级 与 其 他 任意 评级 一 样 可 能 , 每 一 个 都 表示 试验 的 一 个 简单 事 
件 . 例如 ， TRÆ yn» yi, Yi Vaya, Y2, Yz, Ym 分 别 表示 样本 1 和 样本 2 的 4 个 观测 值 ， P Ti 
的 最 小 可 能 值 的 一 种 数据 评级 如 表 15. 4 Bron. 

为 了 求 使 得 PCT; s T.) =0.05 88 T, (8, RIR PCT; 210) , P(T =11),…, 并 且 将 这 些 概率 
相 加 , 直到 

P(T, =10) +P(T i =11) ++ + P(T, = T.) =0. 05 

样本 空间 S 中 简单 事件 的 个 数 等 于 排列 整数 1, 2,…, 8 方式 的 个 数 , 即 81. 因为 简单 事件 是 等 

可 能 的 , 所 以 样本 空间 中 每 个 简单 事件 E; 的 概率 是 : 








P(E,) =E X 15.4 115.4 m n, +n, -8 + 
得 到 T, = 10 的 评级 种 数 为 你 排列 样本 1 00 4 个 秩 和 观测 值 的 一 种 评级 
样本 2 的 4 个 秩 的 方式 的 个 数 . 4 个 秩 的 样本 的 完全 | 样本 1 样本 2 
不 同 排列 方式 共有 41! h, MI, akaga : md : 
秩 的 两 个 样本 的 排列 方式 个 数 为 y Ya ° 
(41)(41) e , l | 
所 以 , 在 事件 = 10 中 共有 (41) (41) 个 简单 事件 ， » ; " 
每 个 事件 的 概率 是 P(E,) - 1/8 ! 从 而 rs -— 
41 4! _ 1 _ 
P(T, =10) = sr =o 70 0143 


其 次 , BEM T 211, 使 得 7) 可 以 等 于 11 的 唯一 方法 是 指派 给 样本 1 的 秩 为 1, 2, 3 和 5. 
从 而 


并 且 

P(T; &11) « P(T, 210) + P(T, =11) =2(0.0143) =0. 0286 
因为 这 个 值 小 于 a=0.05, 所 以 , 我 们 计算 观测 到 T, 的 下 一 个 稍 大 秩 和 , BD T, =12 的 概率 . 如 果 指 
派 给 样本 1 的 秩 为 1, 2, 3 和 6 或 者 1, 2, 4 和 5, 则 可 以 得 到 秩 和 7) = 12. 这 些 情况 中 的 每 一 个 发 生 
概率 是 1/70. 所 以 ， 


P(T, =12) =P{1,2,3,6} +P[1,2,4,5] = = 证 + += 0286 


并 且 
P(T, <12) =P(T, 210) « P(T, =11) +P(T =12) =0. 0572 
因为 我 们 希望 TL 取 使 得 PCT, <T) E a =0.05 的 值 , 所 以 TL 212.0 这 个 的 制 表 值 由 表 B. 15b 
给 出 (a 20.05). 
与 符号 检验 类 似 ， 当 样本 容量 大 时 ,可 以 用 8.5 节 熟 悉 的 Z 检验 统计 量 进行 威 尔 科 克 森 秩 
和 检验 . 下 面 (不 加 证 明 的 叙述 ) 给 出 大 样本 威 尔 科 克 森 秩 和 检验 . 可 以 证 明 秩 和 7, 的 均值 和 
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方差 是 : 
nin, +n (n, +1) 
E(T,) TTE 
K 
nin,(ni +n, +1) 
V(T,) = 12 
因此 , 34 n, 和 no 较 大 时 , 例如 (ni >10, n; >10), 
T, - [i tme tD] 
-EU) | 
MZ 





Jeg +m +1) 


的 抽样 分 布 近似 服从 标准 正 态 分 布 . 步骤 汇总 在 下 面 的 框 格 中 . 

















大 样本 (ni 210, n, >10) 威 尔 科 克 森 秩 和 检验 
X D, # D, 分别 表 示 总 体 1 和 总 体 2 的 相对 频率 分 布 . 
单 侧 检 验 双 侧 检验 
H: D, fa D, 相等 Hy: D, fe D, 相等 
H,; D, 移动 到 D, 的 右边 H,: D, 移动 到 D, 的 左边 或 右边 
(X H,: D, 8368 D, 的 左边 ) 
7, [^ tm Ch +1) 
检验 统计 量 : Z= 
jnn (n4 +n, +1) 
12 
拒绝 域 ; 拒绝 域 : 
Z>z (Ñ Z< -z,) |Z] >z. 
CÈ: 样本 大 小 ni, m 都 必须 至 少 为 10. ) 








应 用 练习 

15.12 j 9) X 5E ES 聚 对 葵 二 甲酸 乙 二 醇 酯 
(PET) 瓶 用 于 装 碳酸 饮料 ,PET 瓶 的 重要 性 质 是 它 
们 的 破裂 强度 ( 即 对 装 满 水 的 瓶子 加 压 使 之 破裂 时 
的 压强 ). 在 Journal of Data Science (2003 年 5 月 ) 
H, 研究 人 员 测 量 了 由 两 种 不 同 设计 一 一 老式 设 
计 和 新 式 设计 制造 的 PET 瓶 的 破裂 强度 , 每 种 设 
计 各 10 个 瓶子 的 数据 (lbyin? ) 由 下 表 给 出 , 假定 
要 比较 两 种 设计 破裂 强度 的 分 布 . 


BÉ LLLA 
老式 设计 210 212 211 211 190 213 212 211 164 209 


新 式 设 计 216 217 162 137 219 216-179 153 152 217 
a. 将 20 个 观测 压力 按 从 小 到 大 的 顺序 排列 ， 并 


指派 从 1 ~ 20 的 秩 . 

.计算 老式 设计 观测 值 的 秩 和 . 

， 计算 新 式 设计 观测 值 的 秩 和 . 

.计算 威 尔 科 克 森 秩 和 统计 量 . 

.进行 非 参数 检验 (a =0.05) 比较 两 种 设计 破裂 
强度 的 分 布 . 

15. 13 燃气 轮机 冷却 方式 . 参考 练习 8.17, Journal 
of Engineering for Gas Turbines and Power( 2005 年 1 
月 ) 关 于 高 压 雾 状 和 人 风 冷 却 装 置 的 燃气 轮机 的 研 
究 . 引擎 热 耗 率 (KJ/AKW . h) 数据 存储 在 GAS- 
TURBINE 文件 . 研究 人 员 将 燃气 轮机 分 为 三 种 
类 型 : 传统 的 、 高 级 的 和 航 改天 然 气 轮机 . 假定 
要 比较 传统 的 和 航 改天 然 气 轮机 引擎 的 热 耗 率 


a a c 
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分 布 . b， 下 面 给 出 比较 两 个 热 耗 率 分 布 的 非 参 数 检 验 的 


a 论述 利用 + 检验 比较 热 耗 率 均 值 所 需 的 假定 很 
可 能 是 违背 的 . 


MINITAB 输出 , 解释 在 输出 底部 给 出 的 检验 的 
p f&. 





N Median 
TRAD-HR 39 11183 
AERO-HR ? 12414 


U = 885.0 





Mann-Whitney Test and CI: TRAD-HR, AERO-HR 


Point estimate for ETAL-ETA2 is -1125 
95.3 Percent CI for ETA1-ETA2 is (-2358,1448) 


Test of ETA1 = ETÀ2 vs ETAL not = 
The test is significant at 0.3431 (adjusted for ties) | 


ETÀ2 is significant at 0.3431 








练习 15.3 的 MINITAB 输出 


15.14 胶原 质 减轻 肿胀 的 能 力 . 型 胶原 质 是 缓解 
风湿 性 关节 炎症 状 的 候选 药物 . 哈佛 大 学 医药 研究 
人 员 进 行 了 一 项 临床 试验 , 检验 胶原 质 减轻 风湿 性 
关节 炎 患 者 肿胀 关节 的 能 力 (Science，1993 年 9 
F). 59 名 患 有 严重 的 急性 风湿 性 关节 炎 病 人 在 30 
天 内 随机 指派 到 接受 日 剂量 胶原 质 或 不 可 辨别 的 
安奈 剂 治疗 组 中 . (28 人 接受 胶原 质 , 31 人 接受 安 
EFA. ) 感 兴趣 的 变量 是 每 位 病人 肿胀 关节 数 的 变 
化 (治疗 后 减 治疗 前 ). 两 个 样本 均值 和 标准 差 如 下 





所 示 . 
胶原 质 安慰 剂 
样本 大 小 28 31 
均值 -2.7 2.0 
标准 差 0.5 1.4 


资料 来 源 : Trentham, D. E. ，et al. “ Effects of oral adminis- 
tration of Type I collagen on rheumatoid arthritis. " Science , 
Vol. 261, No. 5129, Sept. 24. 1993, p. 1727( 1). 


a. RIA Science 的 文章 中 并 没有 给 出 两 组 病人 感 兴 
趣 变 量 的 分 布 信息 ,研究 人 员 运用 威 尔 科 克 森 
秩 和 检验 而 不 是 了 检验 来 比较 两 个 组 . 给 出 两 个 
原因 解释 为 什么 非 参数 检验 在 本 研究 中 比较 
合适 . 

b. 给 出 本 研究 中 用 威 尔 科 克 森 秩 和 检验 的 原 假设 . 

e. 报告 指出 观测 的 显著 性 水 平 小 于 0. 05( 即 p 值 < 
0.05) , 给 出 合理 的 结论 . 

15.15 XE 2 ŁA. 参考 练习 2. 18, Environmental 

Science & Technology(1993 年 10 月 ) 中 关于 休 腿 果 

树 使 用 杀 虫 剂 的 文章 . 在 喷洒 浓度 最 大 的 时 期 ， 每 


天 收集 并 分 析 果树 林 周 围 空 气 的 样本 , 下 表 记 录 了 
空气 样本 中 硫 和 氧 的 浓度 (ngyms ) 及 硫 / 氧 比 . 运用 
非 参数 检验 比较 果园 中 雾 天 和 睛 /多 云天 气 的 硫 / 
氧 比 , 利用 a =0. 05 检验 . 





日 期 ” 条 件 硫 氧 氧 / 硫 
.1 月 15 €x 38.2 10.3 0.270 
17 £X 28.6 6.9 0. 241 
18 雾 天 30.2 6.2 0.205 
19 €x 23.7 12.4 0.523 
20 ŽK 62.3 (空气 样本 丢失 ) 一 
20 ”晴天 74.1 45.8 0.618 
24 ER 88. 2 9.9 0. 112 
21 晴天 46.4 27.4 0.591 
22 K 135.9 44. 8 0. 330 
2 € X 10.9 27.8 0. 270 
22 £z 28.9 6.5 0. 225 
25 €X 46.9 11.2 0. 239 
25 ”晴天 44. 3 16. 6 0. 375 


资料 来 源 : Selber, J. N. , et al. “ Air and fog deposition resi- 
dues of four organophosphate insecticides used on dormant or- 
chards in the San Joaquin Valley , California. " Environmental 
Science & Technology, Vol. 27, No. 10, Oct. 1993, p. 2240 
GR V). 


15.16 ”科罗拉多 州 降雨 . 表 中 数据 来 源 于 Techno- 


metrics( 1986 年 2 H), 表示 科罗拉多 州 两 个 联邦 地 
质 测量 站 收集 的 日 累积 流量 和 降雨 量 (in). 进行 检 
验 判 断 两 个 站 点 的 日 累积 流量 和 降雨 量 的 分 布 是 
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否 存在 位 置 上 的 差异 , 用 w = 0. 10. 行 锌 测量 值 的 分 布 . 
d. 根据 b 和 < 的 结果 , 对 三 个 证 书 位 置 锌 测量 值 
位 置 1 位 置 2 的 均值 能 作出 什么 推断 ? 

127.96 108.91 100.85 | 114.79 85.54 280.55 15.19 土壤 中 的 PCBs. 进行 一 项 初步 研究 获得 关于 
210.07 178.21 85.89 | 109.11 117.64 145.11 BREZ ARKE (PC) ZE 3: Es] +- HERE À p BJ 5 
景 水 平 信息 (Chemosphere，1986 年 2 月 ) , 获得 的 信 
一 一 一 " - 息 可 以 作为 与 英国 废物 处 置 设施 中 PCB 水 平 比较 
D M A OR 有 下 的 业 所 表示 们 于 共 人 农村 
ma distribution. " Technometrics, Vol. 28, No. 1, Feb. 1986, 15 个 城市 采集 的 土壤 样本 中 测量 的 PCB 水 平 (PCB 
p. 83( 表 2). 浓度 单位 是 每 千克 土壤 0. 0001 克 ). 从 这 些 初步 结 
R, 研究 人 员 认 为 “农村 地 区 …… 和 城市 地 区 的 
15.17 TX B dade. 进行 试验 研究 增强 钢 梁 (PCB 含量 ) 有 显著 差别 . ”数据 支持 研究 人 员 的 结 

凸 出 部 分 对 钢筋 混凝土 T 型 钢 梁 扭转 能 力 的 影响 论 吗 ? 用 wa =0. 05 检验 . 





203.24 285.37 330.33 302.74 95. 36 











( Journal of the American Concrete. Institute, 1986 年 ————— TF 
1 -2 月 ). 试验 中 使 用 一 些 不 同类 型 的 T 型 钢 梁 ， 农村 地 区 城市 地 区 
每 种 具有 不 同 凸 出 部 分 宽度 . 在 扭转 和 弯曲 的 组 3.5 5.3 24.0 11.0 
合 下 进行 试验 直至 破坏 ( 即 断 裂 ) , 感 兴趣 的 变量 8.1 9.8 29.0 49.0 
之 一 是 T 型 梁 凸 出 部 分 的 顶部 断裂 的 扭矩 , 8 根 1.8 15.0 16.0 22.0 
es 板 宽 的 和 8 # 100 cm 板 宽 的 断裂 扭矩 如 下 9.0 12.0 21.0 13.0 
T 1.6 8.2 107.0 18.0 
70 cm 6.00 7.20 10.2013.2011.4013.60 9.20 11.20 23.0 9.7 94.0 12.0 
100 cm 6.80 9.20 8.80 13.20 11.20 14. 90 10. 20 11. 80 1.5 1.0 141. 0 18.0 
EDI III LET eU 2 ” 一 C TL U 
存在 差异 吗 ? 用 a =0. 10 检验 . 资料 来 源 ; Badsha, K. , and Eduljee, G. “PCB in the U. K. 
15.18 ”专利 权 侵 犯案 件 . 参考 练习 7.38，Chance environment—A preliminary survey. " Chemosphere, Vol. 15, 
(2002 年 秋 ) 关于 向 英特尔 公司 提出 专利 权 侵犯 诉 No. 2, Feb. 1986, p. 213( 表 1). 专利 1986. Pergamon 出 版 
讼 案 的 研究 , 案件 的 焦点 在 于 专利 证 人 的 签名 是 在 FPA, AME. 


专利 证 书 主页 的 项 部 还 是 底部 . 利用 X HRR, TE "n 
EESSLIJUMVEHERRMRRR EB =a A DIEA m 
(正文 行 .证 人 行 和 正文 行 与 证 人 行 相交 的 行 ) 的 ”15. 20 对 威 尔 科 克 森 秩 和 检验 ,运用 算术 级 数 求 和 
锌 测量 值 由 下 表 给 出 . 公式 证 明 : 

T, +T, = 


15.21 证 明 : Æ n -2, n, -2 的 特殊 情况 下 ,本 节 

给 出 的 威 尔 科 克 森 秩 和 T, 的 期 望 值 公式 成 立 .( 提 
CoC 示 : 列 出 (m +n)! =4! 种 可 能 指派 秩 的 方式 ， 
a， 为 什么 在 练习 7.38 中 使 用 的 学 生 了 检验 对 分 析 并 且 计 算 每 种 指派 下 的 T, , 然后 利用 任 一 指派 概率 


n(n+1) 
正文 行 0.335 0.374 0.440 2 
证 人 行 0.210 0.262 0.188 0.329 0.439 0.397 
相交 行 0.393 0.353 0.285 0.295 0.319 


此 数据 可 能 不 合适 ? 是 等 可 能 的 事实 . ) 
b， 运 用 非 参数 检验 (a =0.05) 比较 正文 行 和 相交 15.22 考虑 m =3 和 n=3 的 威 尔 科 克 酚 秩 和 T. 
行 锌 测量 值 的 分 布 . 运用 本 节 介 绍 的 方法 求 TL, 使 得 


c. 运用 非 参数 检验 (a = 0.05) 比较 证 人 行 和 相交 P(T, = T, ) =0. 05 
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15.4 比较 两 个 总 体 : 配对 设计 


当 使 用 配对 设计 (8. 8 节 ) IH, 非 参数 技术 也 可 用 于 比较 两 个 概率 分 布 ,配对 设计 是 =2 个 处 理 
的 随机 化 区 组 设计 . 在 本 节 中 , 将 介绍 如 何 利 用 威 尔 科 克 森 符号 秩 检 验 来 检验 两 个 总 体 概率 分 布 相 
HBBE, 备 择 假 设 是 一 个 移动 到 另 一 个 的 右边 (或 左边 ). 

例如 , 对 于 某 些 纸 产品 , 纸 的 软 度 是 决定 消费 者 是 否 愿 意 购买 的 重要 因素 , 评价 软 度 的 种 方 
法 是 让 鉴定 人 给 出 产品 样本 软 度 的 等 级 . 假定 10 名 鉴定 人 每 人 得 到 一 个 生产 商 想 要 比较 的 两 种 产品 的 样 
本 , 每 名 鉴定 人 按 从 1 ~ 10 的 等 级 评定 每 种 产品 软 度 ,高 等 级 表示 较 软 的 产品 , de 15.5 给 出 了 试验 结果 . 
: 表 15.5 纸 的 软 度 等 级 





- 
鉴定 人 A i > 。 ey) 差 的 绝对 什 绝对 值 的 秩 
1 6 4 2 2 5 
2 8 5 3 3 7.5 
3 4 5 el 1 2 
4 9 8 1 1 2 
5 4 1 3 3 7.5 
6 7 9 -2 2 5. 
7 6 2 4 4 9 
8 5 3 2 2 5 
9 6 7 sr. a 2 
10 8 2 6 6 10 
T, = 正 秩 的 和 =46 


I T. = 负 秩 的 和 =9 
-一 了 = 负 秩 的 和 9 S 
因为 这 是 配对 设计 , 所 以 分 析 每 对 测量 值 的 差 . 如 果 几 乎 所 有 的 差 均 为 正 ( 或 负 ), 有 证 据 表明 总 体 
概率 分 布 测量 值 的 位 置 不 同 , 即 一 个 位 移 于 另 一 个 的 右边 或 左边 . 非 参数 方法 要 求 计算 测量 值 之 差 绝对 
值 的 秩 (去 掉 所 有 负 号 后 差 的 秩 ). 注意 相等 差 的 绝对 值 的 秩 等 于 它们 如 果 不 相等 但 为 相继 测量 值 时 得 
到 的 秩 的 平均 值 . 对 绝对 差 排 秩 后 , 计算 正 差 的 秩 和 7 了 7, ， 以 及 负 差 的 秩 和 了 _ . 
检验 原 假设 
Ho: 产品 A 和 B 等 级 的 概率 分 布 相同 
对 备 择 假设 
H,: 产品 A 等 级 的 概率 分 布 位 于 产品 B 等 级 的 概率 分 布 的 右边 或 左边 
我 们 利用 检验 统计 量 
T= 正 秩 和 了 ,与 负 秩 和 7_ 中 较 小 者 





威 尔 科 克 森 符号 秩 检 验 : 配对 
WD, fa D, 分 别 表示 总 体 1 和 总 体 2 相对 频率 分 布 . 


单 侧 检 验 双 侧 检 验 
H: D, ff D, 相同 H,: D, fa D, 相同 
H,: D, F D, 的 右边 H,: D, 位 于 D, 的 左边 或 右边 








(X H,: D, 位 于 D, B3 E XR) 
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计算 个 观测 值 对 的 差 . 然后 将 严 个 差 的 绝对 值 按 从 小 ( 秩 1) 到 大 ( 秩 m) 的 顺序 排 秩 , 并 计算 负 差 的 秩 
和 了 _ 及 正 差 的 秩 和 了 .,. 


检验 统计 量 : 检验 统计 量 ; 
MÆRKET  ，( 或 正 差 秩 和 了 , ，) T XE T, T, 
拒绝 域 : T TX T, <T,) 拒绝 域 : T T, 


这 里 T, di B. 16 给 出 . 
CÈ: 删除 等 于 0 的 差 , 并 相应 地 减 小 差 的 个 数 n, 相同 差 的 绝对 值 的 秩 为 它们 不 等 时 得 到 的 秩 的 平均 . ) 


检验 的 拒绝 域 包含 7 的 最 小 值 , 且 对 于 单 侧 统计 检验 使 得 P(T<7T,) = a 的 范围 , 对 双 侧 检验 使 
得 P(T<7To) =a/2 的 了 的 范围 , 表 B. 16 给 出 了 n=5 到 n=50 BJ T, 的 值 . 威 尔 科 克 森 符号 秩 检 验 总 
结 在 上 面 的 框 格 中 , 并 在 例 15. 5 中 进行 阐述 . 
参考 表 15. 5 的 数据 . 利用 威 尔 科 克 森 符 号 秩 检验 比较 鉴定 人 对 产品 1 和 2 评定 的 等 级 ， 
用 a = 0. 05 RI: 

Hy; 产品 1 和 产品 2 的 等 级 分 布 相 同 , 对 备 择 假设 

H,: 一 种 产品 等 级 的 分 布 位 于 另 一 分 布 的 左边 (或 右边 ) , 即 一 个 产品 的 等 级 高 于 另 一 个 

f 这 个 双 侧 检验 的 检验 统计 量 是 较 小 的 秩 和 , BUT. =9. PARETS, 这 里 T 值 由 表 
B. 16 给 出 . 这 个 表 的 部 分 复制 见 表 15. 6. 观察 表 15. 6 的 双 侧 检验 列 , 对 应 于 w = 0.05 的 行 与 = 10 
的 列 , 我 们 读 出 Ty =8. 所 以 , 如 果 了 小 于 或 等 于 8 时 拒绝 Ho. 因为 较 小 的 秩 和 了 _ =9, 不 小 于 或 等 
F8, 所 以 不 能 拒绝 Ho, 没有 充分 证 据 表明 这 两 种 产品 的 等 级 分 布 有 一 个 位 移 . 

表 15.6 表 B.16 的 部 分 复制 









































单 侧 双 侧 n=5 n=6 n=7 n=8 n=9 n=10 
a=0.05 a -0.10 1 2 4 6 8 11 
«2005 | .00 1 2 4 6 8 
a =0.01 a =0. 02 0 2 3 5 
a = 0. 005 a 20.01 0 2 3 

nzll n=12 n=13 n=14 n=15 n=16 
a =0. 05 a =0.10 14 17 21 26 30 36 
a =0. 025 a =0.05 11 14 17 21 25 30 
a =0. 01 a 20.02 7 10 13 16 20 24 
a =0. 005 a 20.01 5 7 10 13 16 19 

n =17 n=18 n=19 n=20 n=21 n=22 
a 20.05 a z0.10 41 47 54 60 68 75 
a = 0. 025 a =0. 05 35 40 46 52 59 66 
a 20.01 a =0. 02 28 33 38 43 49 56 
a =0. 005 & -0.01 23 28 32 37 43 49 

n=23 n=24 n=25 n=26 n=27 n=28 
a =0. 05 a =0.10 83 92 101 110 120 130 
a =0. 025 a=0.05 73 81 90 98 107 117 
a =0.01 a 20.02 62 69 77 85 93 102 
a =0. 005 a =0. 01 55 6l 68 76 84 92 
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图 15. 5 给 出 了 分 析 的 MINITAB 输出 . 注意 MINITAB 利用 了 ，= 46 作为 检验 统计 量 . 检验 的 双 侧 
P 值 (阴影 部 分 ) 是 0.067. 因为 这 个 值 超过 a=0.05, 与 我 们 结果 -不 能 拒绝 Ho 相同 . 


Wilcoxon Signed Rank Test: AminusB 








Test of median = 0.000000 versus median not - 0.000000 


N 
for Wilcoxon Estimated 
N Test Statistic P Hedian 
ÀminusB 10 10 46.0 0.067 2.000 








图 15.5 #j) 15.5 的 MINITAB 威 尔 科 克 森 符号 秩 检 验 
与 独立 样本 的 秩 和 检验 一 样 ， 当成 对 观测 值 个 数 n 较 大 时 (如 nz25), 符号 秩 统计 量 的 抽样 分 
布 可 以 用 正 态 分 布 近似 . 大 样本 Z 检验 汇总 在 下 面 的 框 格 中 . 





大 样本 (n>25) 威 尔 科 克 森 符 号 秩 检 验 
X D, 和 D, 分 别 表示 总 体 1 和 总 体 2 概率 分 布 . 


单 侧 检验 双 侧 检验 
H,: D, f8 D, 相同 H,: D, # D, 相间 
H,: Di 位 于 D, 的 右边 R,: D, 位 于 疡 的 左边 或 右边 


(X. H,: D, 位 于 D, 的 左边 ) 
T, -[n(n +1)⁄4] 
V [n(n +i) (2n +1)]⁄/24 
拒绝 域 : Z>z (或 QZ< -z,) 拒绝 域 : |Z] >z 
假定 : 样本 大 小 n 大 于 或 等 于 25. 删除 等 于 0 的 差 , 并 相应 地 减 小 差 的 个 数 n. 相同 的 绝对 差 的 秩 为 它 
们 不 等 时 秩 的 平均 值 . 


检验 统计 量 : Z= 























威 尔 科 克 森 符 号 秩 过 程 同样 也 可 以 检验 单个 总 体 的 位 置 ， 即 威 尔 科 克 森 检验 可 以 作为 15. 2 节 符 
号 检验 的 另 一 种 方法 . 例如 ， 假定 想 要 检验 下 面 关于 总 体 中 位 数 的 假设 ; 
Ho: 7 = 100 
H.: r »100 
为 了 进行 这 个 检验 , 对 样本 计算 差 (y, - 100) ,符号 检验 仅仅 依赖 于 样本 中 正 差 个 数 . 另 一 方面 ， 符号 秩 检 
验 要 求 是 对 差 排 秩 , 然后 计算 正 差 的 秩 和 . FE, 单个 样本 的 威 尔 科 克 森 符号 秩 检验 完全 与 配对 的 符号 秩 
过 程 一 样 , 除了 差 的 计算 是 从 每 个 观测 值 减 去 假设 的 中 位 数值 之 外 . 我 们 汇总 过 程 在 下 面 的 框 格 中 ， 





关于 单个 总 体 中 位 数 > 的 威 尔 科 克 森 符号 秩 检验 
单 侧 检 验 双 侧 检验 
H,: T =o H,: 7 =o 
H.: r> To H : TÆT 
(RH, r <+.) 
检验 统计 量 : 检验 统计 量 : 
负 的 秩 和 了 _( 或 正 的 秩 和 了 了 ,) EKRE T, IARR T PARET, 
&dE(y -ro) 计 算 样本 差 ， 
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拒绝 域 : T TEXT, T, 拒绝 域 : T< T, 
JF T, 由 表 B. 16 得 到 . 
假定 : 1. 观测 值 的 随机 样本 是 从 总 体 中 抽取 的 ， 
2. y, - vy 的 绝对 值 可 以 排序 .〈《 对 总 体 概 率 分 布 的 形式 不 作假 定 . ) 


3. 删除 等 于 0 的 差 , 并 相应 地 减 小 差 的 个 数 n, 相等 差 的 秩 为 这 些 相 等 观测 值 的 秩 的 平均 . 


























应 用 练习 ag € mka 标准 ag 
15.28 ”新 车 碰撞 测试 . 参考 存储 于 CRASH 文件 中 方法 编码 方法 方法 编码 方法 
国家 高 速 公 路 交通 安全 管理 局 (NHTSA ) 新 车 碰撞 1 0.80 0.78 7 0. 99 0.82 
测试 的 数据 , 在 练习 7.50 中 利用 配对 的 学 生 T Jr 2 0.80 0.80 8 0.98 0.72 
法 比较 司机 和 前 排 乘 客 胸 腔 受伤 的 等 级 . 假定 仅 想 3 0.83 0.86 9 0.81 0.45 
要 比较 司机 是 五 星 级 (最 高 级 ) 的 那些 汽车 . 下 表 4 0.53 0.53 10 0. 95 0.79 
给 出 了 这 样 的 18 辆 汽车 数据 , 考虑 利用 威 尔 科 克 5 oso osi | u 09 07 

森 符 号 秩 检 验 分 析 这 些 数据 . | 6 0.96 0.68 











a. 叙述 原 假 设 与 备 择 假设 . 

b， 使 用 统计 软件 包 求 符号 秩 检验 统计 量 . 
c. 给 出 检验 的 拒绝 域 , 利用 a = 0. 01. 

d， 从 实际 意义 叙述 结论 , 给 出 检验 的 p 值 . 15.25 混凝土 路 面 对 温度 的 反应 . 参考 练习 8.43, 


The International Journal of Pavement Engineering 


资料 来 源 : Ichihara, H. , Shintani, M. , and Inoue , T. 
" Huffman-based test response coding. ” IEICE Transactions on 
Information & Systems, Vol. E88-D, No. 1, Jan. 2005(3& 3). 




















胸腔 受伤 等 级 胸腔 受伤 等 级 (2004 年 9 月) 中 在 新 建 高 速 路 上 混凝土 压力 的 现 
汽车 “司机 乘客 | 汽车 ”司机 RZ 场 研究 . 感 兴趣 的 变量 是 距离 纵向 接 缝 1 m 处 混 凝 
1 42 35 10 36 37 土路 面 的 横向 应 变 ( 即 每 单位 长 度 每 单位 时 间 的 
2 O 35 i 36 37 长 度 变化 ) , 下 表 给 出 了 6 XW 5 h(8: 20 P. M. E 
3 34 45 T 43 58 1:20 A. M. ) 混 凝 土 路 面 的 横向 应 变 变 化 . 利用 非 
参数 检验 分 析 数 据 , 现场 测量 值 和 3D 模型 的 横向 
4 å M â BB % g 应 变 分 布 存在 位 置 变化 吗 ? 用 a =0. 05 检验 . 
5 45 45 14 43 58 - 
6 40 42 ]| 15 37 41 日 期 温度 变化 横向 应 变 变化 
(C) 现场 测量 值 3D 模型 
7 42 46 16 37 41 
10.24 -6.3 -58 -52 
8 43 58 17 44 57 
12.3 13.2 69 59 
9 45 43 18 42 42 
12. 15 3.3 35 32 
15.24 检测 电子 电路 . 参考 练习 8. 42, IEICE Trans- 2.2 -14.8 -32 -24 
actions on Information & Systems ( 2005 #E 1 H ) tB tk 3.25 1.7 -40 -39 
较 两 种 检测 电子 电路 方法 的 文章 . 使 用 标准 压缩 / 5.24 -0.2 -83 -n 





解压 方法 和 新 的 赫 夫 曼 编码 法 检测 11 个 电路 ,并 

且 记录 压缩 比 , 数据 复制 在 下 表 中 . 

a. 在 练习 8. 42 rh, 使 用 i 检验 检验 了 赫 夫 曼 编 码 
方法 比 标准 方法 产生 较 小 的 平均 压缩 比 , 进行 
非 参 数 检验 , W a =0. 05. 

b. 两 种 检验 的 结论 一 致 蚂 ? 


资料 来 源 : Shoukry, S, . William, G. , and Riad, M. “ Val- 
idation of 3DFE model of jointed concrete pavement response 
to temperature variations. ” The International Journal of Pave- 


ment Engineering, Vol. 5, No. 3, Sept. 2004 (XIV). 


15.26 气体 运输 模型 . 参考 练习 8.47, AIChE Jour- 


nal(2005 年 1 月 ) 中 建立 多 成 分 气体 运输 模型 新 方 
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法 的 研究 . 制备 了 12 种 气体 混合 物 , 用 试验 方法 
和 新 的 模型 测量 它们 的 黏度 (10 Pa + s), 表 中 给 
出 了 结果 . 利用 非 参数 方法 检验 化 学 于 程 师 的 结论 
“我 们 的 新 的 计算 方法 和 试验 结果 非常 一 致 . ” 





混合 气体 黏度 测量 值 

试验 新 方法 

1 2.740 2. 736 
2 2. 569 2. 575 
3 2.411 2. 432 
4 2. 504 2.512 
5 3.237 3.233 
6 3.044 3.050 
7 2. 886 2.910 
8 2.957 2. 965 
9 3. 790 3. 792 
10 3. 574 3. 582 
11 3.415 3. 439 
12 3. 470. 3. 476 





资料 来 源 : Kerkhof, P. , and Geboers, M. “Toward a unified 
theory of isotropic molecular transport phenomena. " AIChE 
Journal, Vol. 51, No. 1, January 2005( 3€ 2). 


15.27 机 器 人 实时 调度 . 参考 练习 8. 44 比较 人 工 实 
时 调度 与 使 用 计算 机 控制 的 机 器 人 和 传感器 的 自 
动 方法 的 研究 (ZEEE Transactions, 1903 年 3 月 ). 
由 人 工 调度 和 自动 系统 执行 8 个 模拟 的 调度 任务 ， 
下 表 给 出 了 任务 通过 量 结果 ,利用 非 参 数 检验 比较 
人 工 和 自动 调度 方法 任务 通过 量 . 取 a = 0. 01. 








任务 人 工 调度 自动 调度 
l 185.4 180.4 
2 146.3 248.5 
3 174.4 185. 5 
4 184. 9 216.4 
5 240. 0 269.3 
6 253.8 249. 6 
7 238.8 282.0 
8 263.5 315.9 


——————————É—ÉLLLL 
资料 来 源 : Yih, Y. , Liang, T. , and Moskowitz, H. “ Robot 


scheduling in a circuit board production line; A hybrid OR/ 
ANN approach. " IEEE Transactions, Vol. 25, No. 2, Mar. 
1993, p. 31( 1). 


15.28 TCDD i$ 3t. 参考 练习 8. 46 Tf sg F t ep 21 rh 


存在 的 TCDD 含量 的 研究 ( Chemosphere, 1986 年 2 
A). 回忆 测量 了 4 只 峻 性 牛蛙 某 些 组 织 中 TCDD 
含量 (万 亿 分 之 一 ), 并 记录 这 些 组 织 中 的 TCDD 与 
牛蛙 腿 部 肌肉 中 TCDD 的 比率 , 两 个 组 织 (肝脏 和 卵 
R) 中 污染 物 的 相对 比率 由 下 表 给 出 . 根据 研究 人 员 
"ite fk AE UD MEE ^ dE HU rp TCDD 相对 含量 高 于 
牛蛙 肝脏 中 的 含量 . ”利用 非 参 数 检验 在 a =0.05 检 
验 此 说 法 . (提示 : 用 表 B. 16 给 出 的 n=5 BF T, 值 ， 
求 近似 拒绝 域 . ) 








牛蛙 
A B C D 
肝脏 11.0 14.6 14.3 12.2 
BB £ 34.2 41.2 32.5 26.2 


资料 来 源 : Korfmacher, W. A. , Hansen, E. B. , and Row- 
land, K. L. “Tissue distribution of 2,3,7,8-TCDD in bull- 
frogs obtained from a 2,3,7,8-TCDD-contaminated area. " 
Chemosphere, Vol. 15, No. 2, Feb. 1986, p. 125. 专利 


1986, Pergamon 出 版 社 ， 允 许 重印 . 


15.29 太阳 光照 射 研究 . 参考 练习 7. 48, 污水 处 理 


净化 池 中 热量 损失 的 研究 . Journal of Environmen- 
tal Engineering(1986 年 2 月 ). 在 7 个 晴朗 的 冬日 
里 , 两 个 不 同 纬度 的 中 西部 地 区 全 天 太阳 光照 
射 水 平 (单位 BTU/sq. ft. ) 由 下 表 给 出 , 进行 非 参 
数 检验 比较 两 个 地 区 全 天 照射 水 平 的 分 布 ，. 
e =0. 02. 








日 期 圣 约瑟夫 ， 爱 荷 华 州 

密苏里 大 湖 地 区 
12 月 21 日 782 593 
1 月 6 日 965 672 
1 H21H 948 750 
2H6H 1181 988 
2H21H 1414 1 226 
3 月 7 日 1633 1462 
3 月 21 日 1 852 1 698 


O 
资料 来 源 : Wall, D. J. , and Peterson, G. “Model for winter 
heat loss in uncovered clarifiers. ” Journal of Environmental 


Engineering, Vol. 112, No. 1, Feb. 1986, p. 128. 
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(0) 理论 练习 式 . (注意 : 排列 个 数 8 KHA 
才 于 练习 15. 寺 殊 情况 , 证 明 ， 
15.90 ”对 威 尔 科 克 森 符号 秩 检验 , WEN: 15.32 对 于 练习 15.31 的 特殊 情况 ,证 明 
n(n+1) 
T, p. = E(T,) Pre 
其 中 是 排序 的 非 零 差 的 个 数 . (提示 : 对 练习 15.31 中 列 出 的 8 种 秩 的 排列 , R 
15.91 对 n=2 的 特定 情况 , 旦 数据 中 没有 结 ( 即 没 。 ”每 种 排列 的 7,; 利用 任 一 特定 排列 出 现 的 概率 均 
有 为 零 的 差 ), 列举 出 两 个 绝对 差 8 种 不 同 排序 方 为 1/8 的 事实 . ) 


15.5 比较 三 个 或 更 多 总 体 : 完全 随机 化 设计 


在 14.3 节 我 们 基于 按 完全 随机 化 设计 收集 的 数据 比较 了 上 个 总 体 的 均值 . 用 于 检验 均值 相等 的 
原 假设 的 方差 分 析 检验 是 基于 总 体 服从 公共 方差 为 o2 的 正 态 分 布 假定 的 . 

克 鲁 赛 - 沃 里 斯 五 检验 是 与 方差 分 析 检验 等 价 的 非 参 数 方法 . 它 检验 所 有 上 个 总 体 服 从 相同 
税率 分 布 的 原 假设 , 备 择 假 设 是 分 布 在 位 置 上 不 同 , 即 一 个 或 多 个 分 布 位 于 相互 的 左边 或 右边 . 克 鲁 
赛 - 活 里 斯 万 检验 比较 户 检 验 的 优点 在 于 无 须 对 抽样 总 体 的 性 质 作出 假定 . 
| 完全 随机 化 设计 指定 从 个 总 体 中 选取 n, no, =, ni 个 观测 值 的 独立 随机 样本 为 了 进行 检 
R, 首先 对 所 有 =ni +n + +n 个 观测 值 排序 ,并 且 计 算 个 样本 的 秩 和 TT，…， T, ,相等 观 
测 值 的 秩 用 与 威 尔 科 克 森 秩 和 检验 的 相同 方式 平均 . 然后 , 如果 H, 成 立 , ERRORI HE n, n, 
nn， 每 个 都 容量 或 等 于 5, 则 检验 统计 量 


5 


12 4 T? 
H= aiD È a n1) 
的 抽样 分 布 可 以 用 (4 ~1) 个 自由 度 的 卡 方 分 布 近似 . 大 的 吾 什 意味 着 拒绝 历 ,所 以 , 检验 的 拒绝 天 
Æ H >ya ÉE y, 的 值 是 卡 方 分 布 上 尾 a 处 的 位 置 

检验 汇总 在 下 面 的 框 格 中 , 例 15. 6 介绍 它 的 用 法 





比较 个 总 体 概率 分 布 的 克 和 鲁 赛 - 沃 里 斯 万 检验 ; 完全 随机 化 设计 
所 :上 个 总 体 概率 分 布 相同 . 
及 :个 总 体 概率 分 布 中 至 少 有 两 个 在 位 置 上 不 同 . 





. 2 ÁT 
检验 统计 量 : 刀 = C D 2 p C 3(n+1) 
其 中 : 


n, =Ë ki 中 测量 值 个 数 
全 = 样 本 的 秩 和 ,这 里 每 个 测量 值 的 秩 是 根据 它们 在 个 样本 全 部 数据 中 相对 大 小 计算 的 
n= 总 的 样本 大 小 =n +n +e +n, 

RR: Hy, 8 (k-1)4 B BË 

假定 : 1. 个 样本 是 随机 的 且 独 立 的 . 
2. 每 个 样本 中 有 5 个 或 更 多 个 测量 信 
3. 观测 值 可 以 排序 

(k: 不 须 对 总 体 概率 分 布 的 形状 作出 假定 . ) 
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对 三 个 不 同 品牌 的 磁 控 管 (微波 炉 的 关键 部 件 ) 独立 随机 样本 进行 应 力 测试 , 记录 下 无 
修理 情形 下 每 个 运行 的 小 时 数 . 虽然 这 些 时 间 并 不 能 代表 典型 的 使 用 寿命 ， 但 是 它们 可 以 指出 磁 
控 管 忍受 极端 应 力 如 何 好 , 表 15.7 给 出 了 数据 . 经 验 表明 产品 的 寿命 分 布 常常 是 非 正 态 的 , 于 是 
个 满足 方差 分 析 FF 检验 的 正当 使 用 要 求 的 假定 . ARASA -WE H 检验 确定 是 否 存在 证 据 表 
明 在 应 力 下 不 同 品牌 的 磁 控 管 的 寿命 长 度 趋 于 不 同 . 用 a =0.05 检验 . 

解 进行 克 和 鲁 赛 - 活 里 斯 万 检验 的 第 一 步 是 对 完全 数据 集中 的 n=15 个 观测 值 排序 , 表 15.8 给 
出 了 三 个 样本 的 秩 以 及 秩 和 . 

















表 15.7 例 15.6 中 磁 控 管 的 寿命 期 限 表 15.8 例 15.6 的 秩 及 秩 和 
品 n A 秩 B fk C 秩 
A B C 36 5 49 8 71 14 
36 49 71 48 7 33 4 31 3 
48 33 31 5 2 60 12 140 15 
5 60 140 67 13 2 1 59 11 
67 2 59 53 _ 55 .10 42 6 
53 55 42 T, =36 T, =35 T, 249 
我 们 要 检验 原 假设 
Ho: 三 种 品牌 的 磁 控 管 ， 在 应 力 下 的 寿命 长 度 的 总 体 概率 分 布 相同 
对 备 择 假设 
H,: 至 少 两 个 总 体 的 概率 分 布 在 位 置 上 不 同 
利用 检验 统计 量 ; 





k 2 
MaG aD s 3050 = asag[ C9 «97 109] sus -1.2 


1 
(15)(16)! 5 

HEAR H>, IE 2 有 (1) 个 自由 度 , de B. 给 出 了 xa 的 值 , 对 a 20.05 X 
(k-1)=2 AHE, yà os =5. 99147. 此 检 fun 
验 的 拒绝 域 是 万 > 5.99147， 如 图 15.6 pp À 
^. 因为 计算 的 万 值 , H= 1.22 JT. uds, 
所 以 不 能 拒绝 H, ,没有 充分 的 证 据 表 明 三 种 
品牌 磁 控 管 的 寿命 分 布 之 间 存 在 位 置 上 的 
差异 . 

图 15. 7 给 出 了 分 析 的 SAS 输出 ,输出 的 
阴影 部 分 是 检验 统计 量 和 检验 的 值 ,注意 














p 18(0.5434) 超过 a = 0.05， 得 到 “不 拒绝 0 12 5.99147 H 
Ho” BUEN. | 一 一 E — 


图 15.6 三 个 概率 分 布 比较 的 拒绝 域 























AF x 
628 B 155 
The NPñRIMñY Procedure 
Milcoxon Scores (Rank Sums) for Variable LIFE 
Classified by Variable BRAND 
Sun of Expected Std Dev Mean 
BRAND N Scores Under H6 Under HO Score 
ñ 5 36.0 40.0 8.164956 7.20 
B 5 35.0 40.0 8.164956 7.00 
t 5 49.0 40.0 8.164366 9.80 
Kruskal-Mallis Test 
ee sere —— ^ 1 2206 
Pro» Chi-Bguarn 0/5484 
图 15.7 例 15.6 的 SAS 克 鲁 赛 — 沃 里 斯 检验 
应 用 练习 Kruskal-Wallis Test on HEATRATE 


15.33 其 营 胺 对 于 记忆 的 影响 . 参考 练习 14.11 ; 
Behavioral Neuroscience( 2004 4E 2 月 ) 中 关于 药物 E 
营 胺 对 于 词 对 关联 记忆 影响 的 研究 . 回忆 用 三 个 组 
的 完全 随机 化 设计 一 一 第 一 组 受 试 者 注射 万 车 胺 ， 
第 二 组 受 试 者 注射 安慰 剂 , 第 三 组 受 试 者 不 给 任 
何 药物 . 响应 变量 为 回忆 的 词 对 个 数 , 全 部 28 名 受 
试 者 数据 由 下 表 给 出 . 





第 一 组 ( 芒 著 胺 ): 5 8 8 6 6 6 6 8 6 4 5 6 


BAZEN): 8 10 12 10 9 7 9 10 


第 三 组 (不 给 药 ): 8 9 111211 10 12 12 





a 按 从 小 到 大 的 顺序 对 所 有 28 个 观测 值 排序 . 

b. 计算 第 1 组 观测 值 的 秩 和 . 

c. 计算 第 2 组 观测 值 的 秩 和 . 

d. 计算 第 3 组 观测 值 的 秩 和 |. 

e. 利用 b ~d 的 秩 和 , 计算 克 重 赛 IX ls HEX 

ik. 

t. 进行 克 鲁 赛 - 沃 里 斯 非 参 数 检 验 (a = 0. 05) 比 
较 三 个 组 回忆 的 单词 对 个 数 分 布 . 

.练习 14. 11 中 研究 人 员 认为 第 1 组 受 试 者 呈现 
回忆 最 少 的 词 对 个 数 ,利用 威 尔 科 克 森 秩 和 检 
验 比 较 第 1 组 和 第 2 组 词 对 回忆 个 数 的 分 布 ， 
用 a =0. 05 检验 . 

19.94 燃气 轮机 冷却 方式 . 参考 练习 15.13, Jour- 
nal of Engineering for Gas Turbines and Power ( 2005 
年 1 月 ) 关 于 高 讨 雾 状 人 风 冷 却 装置 的 燃气 轮机 的 
研究. 利用 克 鲁 赛 - 沃 里 斯 检验 比较 传统 、 高 级 和 
航 改 天 燃气 轮机 引擎 的 热 耗 率 分 布 ,分 析 的 MINIT- 
AB 输出 如 下 所 示 . 


Ga 


ENGINE N Median Ave Rank z 
Advanced 21 9669 15.0 -5,39 
Aeroderiv 7 12414 44.1 1.46 


Traditional 39 11183 42.4 4.17 
Overall 67 34.0 


H = 29.13 DF = 2 0.000 
H = 29.13 DF = 2 0.000 (adjusted for ties) 


P 
P 











5&2] 5.34  MINITAB 输出 
a. 给 出 检验 的 原 假设 和 备 择 假设 . 
b. >K a=0.01 的 检验 拒绝 域 中 x 的 临界 值 . 
c. 标 出 MINITAB 输出 中 的 检验 统计 量 并 作 合 适 的 
HEW. 
d. 解释 输出 底部 给 出 的 检验 p 值 . 


15.35 ”湖水 中 的 尔 中 毒 . 参考 练习 10.23, 关于 缅 因 


州 湖 中 和 汞 中 毒 ( EPA ) 的 研究 . 将 湖水 分 为 三 种 营养 
状态 : 贫 营 养 湖 具有 腐烂 动 植物 和 生存 有 机 体 的 
平衡 , 富 营养 湖 在 顶层 水 中 有 较 高 的 腐化 率 , Hi 
养 湖水 中 含有 适当 量 的 营养 物 . 此 项 研究 的 目的 之 
一 是 比较 三 种 类 型 缅 因 湖 中 冬 含 量 的 分 布 , MA- 
INELAKE 文件 中 保存 了 118 个 缅 因 湖 的 汞 的 含量 
( 百 万 分 之 一 ) 和 类 型 . 
a 对 每 种 类 型 的 湖泊 确定 汞 含量 是 否 近 似 服从 正 
态 分 布 . 
b. 根据 a 的 结果 , 解释 为 什么 非 参数 分 析 是 适用 的 . 
c. 构造 克 鲁 赛 - 沃 里 斯 检验 比较 三 种 类 型 缅 因 淹 
REED. 用 a = 0. 05 检验 . 


15.36 DDT 对 和 鱼 的 污染 . 参考 DDT 文件 中 保存 的 被 


污染 鱼 的 DDT 水 平 数 据 . 假定 想 比 较 三 种 鱼 类 体 

内 的 DDT 水 平 : (1) 海峡 铃 鱼 ; (2) / LR 6 ; 

(3) 大 嘴 鲈 鱼 . 

a. 利用 图 法 判断 适用 于 分 析 此 数据 的 是 参数 或 非 
参数 方法 , 请 解释 . 

b. 叙述 非 参 数 方法 分 析 数 据 的 原 假设 和 备 择 假 设 . 


AER EHE 
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c. 利用 合适 的 非 参数 检验 分 析 数 据 , 解释 结果 . 

15.37 dise dh eS ER. 参考 练习 14.9, American 
Journal of Science(2005 年 1 月 ) 中 关于 威斯康星 冰 
清 化 学 组 成 的 研究 . 冰 汗 样品 取 自 5 个 不 同 的 钻井 
(分 别 标记 为 UMRB-1、UMRB-2、UMRB-3、SWRA 
FSD), 对 每 个 样品 测量 铝 与 铀 的 比 ,下 表 给 出 数 
H, 对 这 些 数 据 进 行 非 参 数 方 差分 析 , 取 a=0. 10. 
解释 结 


UMRB-1 3.75 4.05 3.81 3.23 3.13 3.30 3.21 
UMRB-2 3.32 4.09 3.90 5.06 3.85 3.88 
UMBR-3 4.06 4.56 3.60 3.27 4.09 3.38 3.37 
SWRA 2.73 2.95 2.25 
SD 2.73 2.55 3.06 
资料 来 源 : 摘自 American Journal of Science, Vol. 305, No. 
1, Jan. 2005, p. 16( E 2). 


15.38 ”石油 钻井 钻头 的 比较 . 参考 练习 14.67 三 种 
销 头 速度 比较 的 研究 . 将 5 个 钻探 点 随机 指派 给 每 
个 钻头 , 并 记录 下 每 个 钻探 点 在 钻探 3 000 ft Ja BJ 
每 小 时 英尺 穿 透 速度 (RoP). 根据 下 表 列 出 的 信 
E. 能 推断 三 个 钻头 中 至 少 有 两 个 的 RoP 概率 分 
布 不 同 吗 ? 在 显著 性 置信 水 平 a =0. 05 下 检验 . 








PD-1 IADC 1-2-6 IADC 5-1-7 
35.2 25.8 14.7 
30.1 29.7 28.9 
37.6 26.6 23.3 
34. 3 30.1 16.2 
31.5 28.8 20.1 


15.89 8⁄2 Rm. BB E: H WES ARRA 
应 产生 的 , 化 学 反应 中 的 一 项 重要 事项 是 化 学 反 
应 达到 某 一 指定 温度 所 需要 的 时 间 长 度 , 时 间 长 
度 越 短 磷 矿 的 反应 率 就 应 越 高 . 进行 一 项 实验 比较 
在 佛罗里达 的 北部 、 中 部 和 南部 开采 的 磷 矿 的 反 
应 率 , 在 每 个 地 方 分 别 取 得 矿石 样本 , 并 放 人 浓度 


为 56% 的 硫酸 溶液 的 保温 瓶 中 ,记录 下 每 个 样本 达 
到 200 下 的 化 学 反应 时 间 (s). 数据 能 提供 充分 证 
据 表 明 三 个 不 同 地 方 开采 的 磷 矿 反应 率 有 不 同 吗 ? 
用 a 20.05 检验 . 


南 
40.6 38.1 
42.0 41.9 
37.5 










中 北 
25.6 31.3 27.5 
36.4 29.5 


28.2 22.8 













41.1 
38.3 
40.2 


33.5 
35.7 








15.40 RARE. 参考 练习 14.62 比较 生物 体 中 钒 


(V) BJ2& RE (Analytical Chemistry, 1985 年 11 H). 
下 表 中 显示 了 牡 蚌 组 织 、 柑 橘 树叶 、 牛 肝 和 人 类 血 
清 的 干燥 样本 中 V 的 数量 (ng/g). 进行 非 参 数 检 
验 确 定 在 这 4 种 生物 物质 中 钒 浓度 的 分 布 在 位 置 
上 是 否 不 同 ,用 a =0.05 检验 . 





HAR ”柑橘 叶片 牛 肝 人 类 血清 
2.35 2.32 0. 39 0. 10 
1.30 3.07 0. 54 0.17 
0.34 4. 09 0. 30 0. 14 

0.16 
0. 16 


资料 来 源 : Fasselt, J. D. , and Kingston, H. M. " Determi- 
nation of nanogram quantities of vanadium in biological materi- 
al by isotope dilution thermal ionization mass spectrometry with 
ion counting detection. " Analytical Chemistry, Vol. 57, No. 
13, Nov. 1985, p. 2475 ( 3& II). American Chemical Society. 
允许 重印 . 


理论 练习 
15.41 利用 算术 级 数 的 和 证 明 克 鲁 赛 - 沃 里 斯 H 


检验 ， 


TD T 20D) 


这 里 是 被 比较 的 概率 分 布 个 数 , n 是 总 的 样本 
容量 . 


15.6 比较 三 个 或 更 多 总 体 : 随机 化 区 组 设计 


在 这 节 , 介绍 14. 5 节 给 出 的 随机 化 区 组 设计 方差 分 析 下 检验 等 价 的 非 参 数 方法 . 由 密 尔 顿 - 3b 
里 德 曼 ( 诺 贝尔 经 济 学 奖 获 得 者 ) 提出 的 检验 , 尤其 适用 当 方 差分 析 要 求 的 正 态 性 和 共 方 差 性 假定 不 
(或 者 可 能 不 ) 满 足 时 , 比较 个 或 更 多 个 总 体 概率 分 布 的 相对 位 置 . 

为 了 进行 到 检验 , 首先 对 每 一 区 组 的 观测 值 排序 , 然后 计算 个 处 理 的 秩 和 TT,，…, T. 如 
果 H; 为 真 ( 即 如 果 总 体 概率 分 布 相等 ) 并 且 观 测 值 个 数 ” 很 大 , 则 F. 统计 量 : 
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F. = 3b(k +1) 


- Ym - | 
将 有 一 个 自由 度 为 (4 一 1) 的 卡 方 分 布 近似 的 抽样 分 布 . 为 了 使 近似 性 合理 地 好 , 要 求 区 组 数 5 或 处 
理 个 数 超 过 5. 检验 的 拒绝 域 由 F 的 大 值 组 成 , 所 以 , 当 F >x2 时 , 拒绝 Ho. 

PEWS F, 检验 汇总 在 下 面 框 格 中 , 在 例 15.7 中 介绍 它 的 使 用 . 





随机 化 区 组 设计 的 弗 里 德 曼 F. 检验 
如 :上 个 总 体 的 相对 频率 分 布 相等 . 
H: 个 总 体 中 至 少 有 两 个 在 位 置 上 不 同 (移动 到 另 一 个 的 右边 或 左边 ). 
检验 统计 量 : 对 每 个 区 组 内 的 个 观测 值 按 从 小 ( 秩 1) 到 大 ( 秩 ) 的 顺序 排 秩 , 计 算 处 理 的 秩 和 n, 














T,, =, To 那么 检验 统计 量 为 : | ; 
"WE T —3b(k+1) 
这 里 5= 试 验 中 所 用 的 区 组 数 ,= 处 理 的 个 数 , T= 第 i 个 处 理 的 秩 和 ， 
拒绝 域 : 


Foy, 这 里 他 有 (一 1) 个 自由 度 . 

假定 : 1. 个 处 理 随机 指派 给 每 个 区 组 中 的 个 试验 单位 . 
2. 为 了 使 卡 方 近似 是 适当 的 ， 区 组 数 已 或 处 理 数 左 应 该 超过 5. 
3， 相 等 观测 值 的 秩 等 于 它们 不 相等 时 指派 给 这 些 观 测 值 秩 的 平 


R 











3. 








在 许多 机 械 设备 中 不 同 金属 的 腐蚀 是 个 问题 . 检验 用 于 帮助 减少 腐蚀 的 三 种 密封 容器 ， 
判断 它们 之 间 是 否 存在 差异 . 10 种 不 同 的 金属 成 ” 表 15.9 例 15.7 的 随机 化 区 组 设计 的 数据 以 及 秩 














分 样本 放 入 三 个 密封 容器 中 的 每 一 个 进行 处 理 ， n 密封 容器 
暴露 在 相同 环境 1 个 月 后 测量 腐蚀 量 , 表 15.9 给 T i - 秩 3 Ë 
出 了 数据 和 它们 对 应 的 秩 . 存在 证 据 表明 三 种 类 2 |a 2 |x 3 (B o! 
型 密封 容器 之 间 腐 蚀 量 的 概率 分 布 不 同 吗 ? 利用 3 16 1 19 3 18 2 
a =0. 05 检验 . 4 20 3 19 2 18 1 
E 我们 想 要 检验 原 假设 » ， ; » ， 
s 7 18 25 | 18 25 | 1 i 
x 35 8 26 2 32 3 21 1 
至 少 两 个 概率 分 布 在 位 置 上 不 同 9 17 2 20 3 9 1 
9 给 出 了 每 个 区 组 内 三 种 处 理 的 秩 以 20 4 2 10 3 2 l 
及 处 理 的 秩 和 . 所 以 , F, 统计 量 的 计算 值 为 | TIOS | 0-265 nM 








F, = "OPEP T? -3b(k +1) = ioa at O9 5)? + (26.5)? + (14)2] -3(10)(4) = 7.85 
注意 这 个 值 与 图 15. 8 MINITAB 输出 阴影 部 分 的 检验 统计 量 一 致 . 
检验 的 拒绝 域 是 F, >X6.0s ,这 里 基于 k-1=2 个 自由 度 的 如 0 的 制 表 值 (由 表 B. 8 给 出 ) 是 
3.99147. FÆ, 如果 F, >5. 99147, 将 拒绝 Ho. 
因为 计算 的 检验 统计 量 F, =7. 85 REG os =5. 99147, 所 以 有 充分 的 证 据 拒绝 H, , 并 且 推 断 两 
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个 或 者 更 多 个 腐蚀 的 概率 分 布 在 位 置 上 存在 差异 , 检验 的 p 值 (图 15. 8 阴影 部 分 ) 支 持 这 个 结果 , K 
际 的 结论 是 有 证 据 表明 三 种 密封 容器 的 密闭 能 力 是 不 同 的 . 





8 e 7.85 DF = 2 P > 0,02G 


Sum 
of 
SEALER N Est Median Ranks 


1 10 16.583 19.5 
2 10 19.417 26.5 
3 10 12.750 14.0 





Grand median - 16.250 


Friedman Test: CORROSION versus SEALER blocked by METAL 


5 = 8.0S DF = 2 P = 0.018 (adjusted for ties) 








El 15.8 例 15.7 if] MINITAB 弗 里 德 曼 检 验 


应 用 练习 

15.42 ”回旋 式 石 油 钼 并 机 . 参考 练习 14.16, World 
OU(2002 年 1 月 ) 回 旋 式 石油 销 井 机 的 研究 . 随机 
选择 3 个 月 并 记录 下 位 于 加 利 福 尼 亚 州 、 犹 他 州 和 
阿拉 斯 加 州 这 三 个 州 的 石油 销 探 设备 的 运转 数量 ， 
下 表 给 出 了 随机 化 区 组 设计 的 数据 . 进行 非 参 数 检 
验 比较 三 个 州 运转 的 回旋 式 钻井 机 分 布 . 


月 /年 。 加利福尼亚 犹他 阿拉 斯 加 





11/2000 27 17 11 
10/2001 34 20 14 
11/2001 36 15 14 

a. 叙述 检验 的 原 假设 和 备 择 假设 . 

b， 对 每 个 月 数据 排 秩 , 然后 计算 每 个 州 的 秩 和 |. 

c. 利用 b 的 秩 和 求 检 验 统计 量 的 值 . 

d. 给 出 a =0. 05 时 检验 的 拒绝 域 . 

e. 用 本 问题 的 语言 叙述 结论 ,这 个 结论 与 练习 


14.16 ANOVA F 检验 的 结论 一 致 吗 ? 

15.43 ”驾驶 过 程 中 精神 泡 散 影响 的 研究 . 对 在 驾驶 
过 程 中 执行 口头 的 和 视觉 搜索 空间 形象 任务 的 结 
果 进 行 研究 , 结论 发 表 在 Journal of Experimental 
Psychology Applied( 2000 年 3 月 ). #E2£ T 12 名 司机 
在 西班牙 马德里 的 高 速 公 路 上 驾驶 汽车 , 每 位 司 
机 在 驾驶 过 程 当中 要 求 执行 三 项 不 同 的 任务 ; H 
头 任务 (重复 由 某 个 字母 开头 的 单词 )、 空 间 形 象 
任务 (想象 按 某 种 方法 循环 的 字母 ) 和 没有 精神 上 
的 任务 . 由 于 每 一 个 司机 都 要 执行 全 部 三 项 任务 ， 
所 以 设计 有 12 个 区 组 (司机 ) 和 3 种 处 理 ( 任 务 ) 的 
随机 化 区 组 . 使 用 计算 机 化 的 免 提 眼球 跟踪 系统 ， 
研究 者 保持 了 每 位 司机 在 三 种 不 同 目标 (内 镜 , 后 
镜 及 里 程 器 ) 上 眼球 注视 记录 , 并 确定 眼球 注视 的 


目标 比例 . 研究 者 用 弗 里 德 曼 非 参数 检验 比较 在 二 

种 任务 下 眼球 注视 比例 的 分 布 . 

a. 用 a=0.01 求 弗 里 德 曼 检验 的 拒绝 域 . 

b. 对 于 响应 变量 , 眼睛 注视 内 镜 的 比例 , 研究 者 
给 出 弗 里 德 曼 检验 统计 量 为 =19.16, 给 出 合 
适 的 结论 . 

c， 对 于 响应 变量 , 眼睛 注视 后 镜 的 比例 , 研究 者 给 出 
弗 里 德 曼 检 验 统计 量 为 XY =7. 80. 给 出 合适 的 结论 . 

d. 对 于 响应 变量 , 眼睛 注视 里 程 器 的 比例 , 研究 
者 给 出 弗 里 德 曼 检验 统计 量 为 XY = 20. 67, 给 出 
合适 的 结论 . 


15.44 ”建筑 物 的 偏 移 比 . 参考 练习 14.19, Microcom- 


puters in Civil Engineering 关于 建筑 物 侧 向 位 移 的 研 
究 . 下 表 的 数据 是 在 5 个 不 同 建筑 物 楼 层 的 每 一 层 
用 三 种 不 同 计算 程序 估计 的 侧 向 位 移 (in) , 利用 合 
适 的 非 参 数 检验 比较 三 个 计算 机 程序 估计 的 侧 向 
位 移 的 分 布 ,用 a = 0. 05 检验 . 





水 平 STAAD-HI(1) STAAD-II(2) 漂移 
1 0.17 0.16 0.16 
2 1.35 1.26 1.27 
3 3.04 2.76 2.77 
4 4.54 3.98 3.99 
5 5.94 4. 99 5.00 


资料 来 源 ; Valles, R. E. , et al. "Simplified drift evaluation 
of wallframe structures. ” Microcomputers in. Civil Engineering , 


Vol. 8, 1993, p. 242( € 2). 


15.45 ”评估 无 铅 焊料 . 参考 练习 14. 20, Soldering & 


Surface Mount Technology ( Vol. 13, 2001) 比较 4 种 
焊接 方法 的 研究 . 测量 了 每 种 焊料 类 型 在 6 种 不 同 
温度 下 焊料 的 塑性 硬度 (Nm/m' ) , 数据 显示 在 表 
中 . 利用 合适 的 非 参数 方法 分 析 数 据 , 解释 在 a = 
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0. 10 时 的 结果 . (E) 
# E) 8-5 锡 - 银 du 锡 - 银 - 铜 周 “ 星 期 一 ”星期 二 ”星期 三 “星期 四 EPE 
23 50. 1 33.0 14. 9 41.0 5 23.5 9.6 11.3 13.6 14.1 
50 24.6 27.7 10. 5 20.7 6 9.1 4.5 7.5 2.1 9.3 
75 23.1 10. 7 9.3 17.1 7 1.1 4.2 4.1 4.2 4.1 
100 1.8 9.0 8.8 8.7 8 9.5 7.1 4.5 9.1 12.9 
125 L1 4.9 5.4 7.1 9 4.8 5.2 10.0 6.9 9.0 
150 0.3 3.2 5.0 4.9 资料 来 源 : Boggis, J. J. "The eradication of leisure. ” New 


一 一 一- S 
WF RÆ: Harrison, M. R. , Vincent, J. H. , and Steen, H. 


A. H. “Lead-free reflow soldering for electronics assembly. ” 
Soldering & Surface Mount Technology, Vol. 13, No. 3, 2001 
(x X). 

15.46 ”测试 光标 阅读 机 . 光标 阅读 机 ( OMR) 是 一 种 
能 够 “阅读 "在 某 种 特殊 表格 中 铅笔 标记 的 机 器 ， 
OMR 厂商 相信 他 的 产品 能 够 在 各 种 温度 和 湿度 环 
境 下 同样 好 地 运行 . 为 了 确定 运行 结果 是 否 与 这 一 
期 望 矛盾 , 厂商 要 求 一 个 著名 的 工业 测试 实验 室 测 
试 他 们 的 产品 . 随机 选取 5 台新 近 生产 的 OMR, 每 
一 台 在 6 种 不 同 环境 下 运行 , 记录 下 每 台 机 器 在 1h 
内 能 够 处 理 的 表格 数 ,作为 OMR 运行 效率 的 度量 ， 
数据 见 下 表 . 利用 弗 里 德 曼 F, 检验 判断 是 否 有 证 据 
表明 至 少 在 两 个 环境 下 设备 每 小 时 处 理 表格 数量 的 
概率 分 布 在 位 置 上 是 不 同 的 , 用 a =0. 10 检验 . 

环境 





Technology, Work, and Employment, Vol. 16, No. 2, July 
2001(3& 3). 


15.48 工程 师 的 压力 . 进行 -- 项 探索 工程 师 职业 压 


JIR W RY A A (IEEE Transactions on Engineering 
Management 1986 年 2 月 ). 目的 之 一 是 确定 “对 处 于 
编制 等 级 不 同 水 平 的 工程 师 们 是 否 存在 一 致 的 显著 
差别 , 在 哪 种 程度 上 他 们 将 不 同 因素 作为 压力 来 
源 .“ 对 来 自 加 拿 大 安大略 省 的 不 同 编制 类 型 的 男性 
工程 师 样 本 进行 压力 诊断 调查 (SDS). SDS 为 15 类 
工作 压力 的 每 一 个 提供 了 压力 等 级 , 研究 人 员 将 4 
组 工程 师 ( 非 管理 人 员 、 一 -级 管理 人 员 、 二 级 管理 人 
员 和 三 级 管理 人 员 ) 的 每 一 组 将 15 个 压力 类 型 排 
Ë, 从 1( 最 大 压力 ) 到 15( 最 小 压力 ), 如 下 表 所 示 . 
进行 检验 判断 4 组 工程 师 之 间 压 力 类 型 的 秩 的 顺序 
是 否 存在 差异 , 用 a =0.01 进行 检验 . 
非 管 理 一 级 管 ” 二 级 管 ”三 级 管 














WES 0 2 3 4 s 6 SARE O AA BAR BAR MAR 
1 8001 8025 $8100 8055 7991 8007 政治 5 6 4 7 
2 7910 7932 7900 7990 7892 7922 未 充分 使 用 3 5 7 5 
3 8111 8101 8201 8175 8102 8235 人 力 资 源 发 展 4 3 2 3 
4 7802 7820 7904 7850 7819 8100 管理 形式 6 7 8 8 
5 750 7601 7702 7633 7600 7561 奖励 1 1 l 4 
组 织 结构 9 9 10 12 
15.47 ”牛仔裤 厂 的 缺勤 率 . 参考 练习 14.22, New 参与 性 2 4 5 6 
Technology, Work, and Employment ( 2001 年 7 月 ) 关 角色 模糊 10 13 12 14 
于 牛仔 裤 厂 每 日 工人 缺勤 率 的 研究 . 随机 选取 9 个 超 负荷 /定量 15 15 15 15 
星期 并 确定 工作 周 每 一 天 ( 从 星期 一 到 星期 五 ) 的 超 负 荷 /定性 12 8 6 2 
缺勤 率 ( 缺勤 工人 的 百分比 ) , 数据 显示 在 表格 中 . 时 间 压 力 8 2 3 1 
进行 数据 的 非 参 数 分 析 比 较 工 作 周 中 五 天 的 缺勤 角色 冲突 13 10 13 10 
率 的 概率 分 布 . 职业 发 展 7 nm 9 13 
周 星期 一 ”星期 二 ”星期 三 ”星期 四 EME 工作 范围 11 12 14 11 
1 5.3 0.6 1.9 1.3 1.6 社会 责任 14 14 11 9 
2 12.9 9.4 2.6 0.4 0.5 资料 来 源 : Salch, S. D. , and Desai, K. “ Occupational 
3 0.8 0.8 5.7 0.4 1.4 stress for engineers. " IEEE Transactions on Engineering Man- 
4 2.6 0.0 45 10.2 45 agement, Vol. EM-33, No. 1, Feb. 1986, p. SCE H). @ 


1986, IEEE. 
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15.7 非 参 数 回 归 


TE 11. 13 节 中 学 习 了 当 违 背 随机 误差 项 e 的 假定 时 如 何 修正 回归 分 析 . 例如 , 如 果 e 的 方差 o7 
不 是 常数 , 利用 11. 13 节 讨论 的 方差 稳定 性 变换 对 因 变 量 y 进行 变换 . 另 一 种 方法 是 进行 数据 的 非 参 


数 回归 分 析 . 


在 非 参数 回归 中 , 模型 适当 性 的 检验 不 需要 对 e 的 概率 分 布 作 任何 假定 ; FE, 它们 是 分 布 自 
由 的 . 虽然 这 种 检验 具有 直觉 上 的 吸引 力 , 但 是 实际 使 用 中 却 可 能 变 得 相当 困难 , 特别 是 当 观测 值 
个 数 较 大 时 . 由 于 这 个 原因 ,以 及 已 经 可 以 由 计算 机 进行 残 差 诊断 的 事实 ， 当 标准 的 回归 假定 违背 


时 , 大 多 数 分 析 师 愿意 使 用 11. 13 节 的 技术 . 


对 于 那些 感 兴趣 的 人 们 , 我 们 为 第 10 章 的 参数 简单 线性 回归 检验 提供 非 参 数 方法 简洁 描述 , 特 
别 讨论 (1) 秩 相关 和 (2) 直线 模型 斜率 参数 的 非 参 数 检验 . 


斯 皮尔 曼 秩 相关 


斯 皮尔 曼 秩 相关 作为 另 一 种 皮尔 逊 乘 积 矩 相 关系 数 r( 10.7 节 ) ,可 以 计算 基于 秩 的 相关 系数 . 


斯 皮尔 曼 秩 相关 系数 ,， 记 作 r,, 可 以 用 来 检验 两 个 变量 y 和 % 的 秩 相 关 性 . 


为 了 阐述 这 个 问题 , 假定 一 个 大 型 生产 公司 想 要 
判断 每 个 员工 每 年 缺勤 的 工时 数 y 和 员工 的 年 薪 x 
( 千 美 元 ) 是 否 相 关 , 表 15.10 给 出 了 15 名 员工 数据 
的 样本 . 

为 求 斯 皮尔 曼 秩 相关 系数 , 首先 对 每 个 变量 的 值 
分 别 配 秩 ( 结 的 秩 为 这 些 结 的 秩 的 平均 值 ) , 然后 与 求 
皮尔 逊 相关 系数 > 完全 一 样 的 方法 计算 ~ 唯一 的 差 
别 是 出 现在 7 公式 中 的 x 和 y 的 值 用 它们 的 秩 代 替 ,， 即 
用 原始 数据 的 秩 而 不 是 原始 数据 本 身 计算 r,. 当 秩 中 没 
有 (或 很 少 ) 结 的 时 候 , 公式 可 以 化 简 为 简单 的 表示 式 ; 

exd 
~ n(n? -1) 
这 里 d; 是 第 ;个 观测 的 y A x 的 秩 之 差 

表 15. 10 还 给 出 了 15 名 员工 的 y fll x 的 秩 、 秩 的 
差 以 及 差 的 平方 , 注意 差 的 平方 和 是 工 d2 =1 038. 将 
AMERA r, 公式 中 , 得 到 

„1 62di , 6(1038) _ 

' aQG)-1) — 15(24) ` 
利用 统计 软件 也 可 以 得 到 7, 的 值 . 图 15.9 给 出 分 析 的 
SPSS 输出 , 在 输出 中 着 重 显示 的 x, 值 与 我 们 计算 的 
值 -0. 854 一 致 . 





r =l 


s 








_ 0. 854 


15.10 15 名 员工 缺勤 时 间 、 年 薪 以 及 秩 





员工 缺勤 小 E, yE x 的 Ed 2 
BF, y x A #* 

1 49 15.8 6 11 -5 25 
2 36 17.5 4 12 -8 64 
3 127 11.3 13 2 11 121 
4 91 13.2 12 6 6 36 
5 72 13.0 9 5 4 16 
6 34 14.5 3 9 -6 36 
7 155 11.8 14 3 11 121 
8 11 20.2 2 14 -12 144 
9 191 10.8 15 1 14 196 
10 6 18.8 1 13 -12 144 
11 63 13.8 8 7 1 1 
12 79 12.7 10 4 6 36 
13 43 15.1 5 10 -5 25 
14 57 24.2 7 15 -8 64 
15 82 13.9 11 8 3 9 
Xd? =1 038 
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Correlations 


HOURS WAGES 
Spearman's rho HOURS Correlation Coefficient 
Sig. (2-tailed) 
N 





Correlation Coefficient 
Sig. (2-tailed) 
N 





**. Correlation is significant at the 0.01 level (2-tailed). 
Hd 15.9 3& 15.10 中 数据 的 SPSS 斯 皮尔 曼 相关 
表 15. 11 附录 B 表 17 斯 皮尔 曼 的 /, 表 的 一 部 分 
相应 于 Hy: p, =0 的 单 侧 检验 的 a 值 对 双 侧 检 验 , 应 该 将 a 的 表 中 值 扩大 1 Ë 











n a =0.05 a -0. 025 a -0.01 a =0. 005 
5 0. 900 — — — 
6 0. 829 0. 886 0. 943 — 
7 0.714 0.786 0.893 — 
8 0. 643 0. 738 0. 833 0. 881 
9 0. 600 0. 683 0. 783 0. 833 
10 0. 564 0. 648 0. 745 0.794 
11 0. 523 0. 623 0.736 0. 818 
12 0. 497 0. 591 0.703 0.780 
13 045 ^7 0.566 0.673 0.745 
0.457 0.545 0.716 
0.441 0.525 0.689 








16 0.425 0.507 0.601 0.666 


这 个 大 的 负 值 表明 样本 中 缺勤 小 时 数 y 与 年 薪 x 之 间 存 在 相当 强 的 负 相 关 性 . 

为 了 确定 总 体 中 是 否 存在 负 的 秩 相关 性 , 需要 利用 r | 作为 检验 统计 量 检 验 Hosp =0 对 H: p< 
0. 正如 期 望 的 , 对 于 较 小 的 r+, 我们 拒绝 Ho. 表 B. 17 给 出 TREKS r, 上 尾 临 界 值 ， 这 个 表 的 一 部 
分 如 表 15. 11. 因为 r, 的 分 布 关 于 0 对 称 ， 所 以 下 尾 临界 值 是 相应 的 上 尾 临界 值 的 负 值 . 例如 对 于 
«20.011 n —15, 临界 值 ( 表 15.11 阴影 部 分 ) 是 ro 0 =0. 623. TE, 检验 拒绝 域 是 : 

AUR r, < -0.623, 拒绝 H, 

因为 检验 统计 量 r, = -0. 854 落 和 拒绝 域 中 ， 所 以 有 充分 的 证 据 表明 (a = 0.01) 总 体 中 缺勤 小 时 数 y 
SER x 之 间 存 在 负 相关 . ( 注 : 检验 的 p 值 在 图 15. 9 中 着 重 显示 . ) 

总 体 秩 相关 的 斯 皮尔 曼 非 参数 检验 汇总 在 下 面 的 框 格 中 . 





秩 相关 的 斯 皮尔 曼 非 参数 检验 
单 侧 检验 双 便 检验 
H,:p=0 Ho: p=0 
H,: p»0(X H,: p<0) H,: p 0 
6xXd 


检验 统计 量 :r, -1 EERE 











非 参 数 统计 
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这 里 d, 是 第 i 个 观测 y BUR x 秩 之 差 . 


拒绝 域 : r, >r. (Xr, < —r,) 
3X Er, 和 ru 的 值 由 附录 也 表 17 给 出 . 
假定 ; 没有 











拒绝 域 : Ir] 2l 





(QE: 当 有 结 的 时 候 , E y BQ kia x RRE 10.7 节 的 r 公 式 中 y 和 的 值 来 计算 +. ) 





我 们 还 可 以 通过 检验 简单 线性 回归 模型 
y7gotBix +E 
的 斜率 参数 B, 来 检验 总 体 的 线性 相关 性 ， 即 可 以 检 
Wy Ho: By =0 XE H,: B, # 0. 斜率 的 分 布 自由 检验 是 
FERA C 检验 . 

为 了 进行 这 个 非 参 数 检验 ,首先 按 升序 对 x 值 进 
行 排 秩 , 并 且 列 出 有 序 对 (x, y), 如 表 15.12 所 示 . 然 
后 计算 所 有 可 能 的 差 y, -y ij GX HL UR 分别 代表 
第 ;个 和 第 7 个 经 排 秩 后 的 观测 值 ) ,并 注意 每 个 差 的 
符号 ( 正 或 负 ). 

例如 , KAR 的 员工 的 y 值 是 y, = 127, 与 比 他 
更 低 秩 的 每 个 员工 的 y 值 进行 比较 . 在 这 种 情况 下 ， 
更 低 秩 的 员工 只 有 秩 为 #1 的 员工 , yí = 191( 见 表 
15.12), 3 

y; - y) =127 - 191 = - 64 
是 负 值 , 并 记 成 如 表 15. 12 那样 . 

类 似 地 , 将 秩 为 #3 的 员工 的 y 值 y = 155, 与 更 
低 秩 的 员工 的 y 值 yz =127 和 yi = 191 进行 比较 , 计 
算 差 


R15.12 RER X 对 表 15.10 的 数据 排 秩 





员工 缺勤 时 ”年薪 ， yoy (i<)) 
的 秩 “ 数 , 7 x 负 的 个 数 。”” 正 的 个 数 
1 191 10.8 — — 
2 127  1L3 1 0 
3 155  1L8 1 1 
4 79 12.7 3 0 
5 72 13.0 4 0 
6 91 13.2 3 2 
7 63 — 13.8 6 0 
8 82 13.9 4 3 
9 34 14.5 8 0 
10 43 15.1 8 1 
11 49 15.8 8 2 
12 36 17.5 10 1 
13 6 188 12 0 
14 1 202 12 1 
15 57 24.2 8 6 
总 和 :88 —— 0107 


ys — Y2 2155 - 127 =28 


和 


ya —Y1 =155 -191 = -36 


得 到 一 个 正 差 和 一 个 负 差 . 如 此 下 去 , 得 到 总 共 17 个 正 差 和 88 个 负 差 , 如 表 15.12 所 示 . 
为 每 一 个 正 差 得 分 +1, 为 每 一 个 负 差 得 分 -1( 为 0 的 差 得 分 为 0) 并 且 将 得 分 相 加 得 到 检验 统 


计量 C. 所 以 , 对 于 表 15. 12 的 数据 , 得 到 检验 统计 量 


C-(*1)(17)) *(-1)(88) = -71 


检验 的 观测 显著 性 水 平 (p E) 由 表 B.18 得 到 . 对 于 下 尾 检 验 ， BD TA RE SERES, p 值 是 
P(Cs -71). ÆR B. 18 中 寻找 n=15 9 x 281 15, 我 们 得 到 p 值 ~0. FE, 有 强 的 证 据 拒绝 Ho, 


并 推断 在 这 家 公司 中 缺勤 小 时 数 y SER x 之 间 有 负 线 性 关系 . 


一 般 地 , 直线 模型 斜率 的 泰 尔 检验 在 下 面 的 框 格 中 给 出 . 还 可 以 构造 基于 泰 尔 检验 的 斜率 B; 的 


非 参数 置信 区 间 . 如 果 想 学 习 如 何 构造 这 个 区 间 , 可 以 阅读 参考 文献 . 
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直线 模型 7?=B, +B,x += 零 斜 率 的 泰 尔 检验 
单 侧 检验 双 侧 检验 
Ho: B, =0 H,: B, =0 
H,: By »0( X H,: B, «0) H.: B, # 0 


检验 统计 量 : C= (-1)( 42 y -y 的 个 数 ) + (1)( 正 差 y; = y, 的 个 数 ) 
XE y, 和 是 按照 * 值 升序 排列 的 第 i 个 观测 值 与 第 j 个 观测 值 ， i<j. 


观测 的 显著 性 水 平 ， 观测 的 显著 性 水 平 : 
P(xzC) 对 已 : B >0 了 值 =2 min(p, , p,) 
"beso XH: B, «0 其 中 : 
Pi = P(x> C) 
p, = P( x< G) 


这 里 P(x 之 C) = P(x= - C) Ë X B. 18 给 出 . 
假定 : 随机 误差 e 是 独立 的 . 











非 参 数 检验 同样 适用 于 多 重 回归 模型 , 但 这 些 检 验 非 常 复杂 ， 并 且 需 要 使 用 还 不 能 商品 化 的 特 


殊 统 计 计 算 软 件 , 如 果 想 要 学 习 更 多 的 非 参 数 技术 ， 可 以 阅读 参考 文献 . 


应 用 练习 

15.49 延长 熔 铝 夫 翅 的 寿命 . 参考 练习 10.7, The 
American Ceramic Society Bulletin (2005 年 2 月 ) 关 于 
熔 铝 霸 塌 使 用 寿命 的 研究 . 因为 霸 塌 的 寿命 依赖 
于 砖 衬 的 孔隙 率 ， 研究 人 员 测 量 了 表 观 的 孔 院 率 
以 及 6 种 砖 每 个 孔径 的 均值 ,下 表 给 出 了 相应 
数据 . 





砖 GOL BOR) 孔径 均值 (pm) 
A 18.8 12.0 
B 18.3 9.7 
C 16.3 7.3 
D 6.9 5.3 
E 17.1 10.9 
F 20.4 16.8 


资料 来 源 : Bonadia, P. , 
for aluminum cell linings. ” The American Ceramic Society Bul- 
letin, Vol. 84, No. 2, Feb. 2005 ( 3 II ). 


a. 对 6 种 砖 的 表 观 孔隙 率 值 排 秩 , 然后 对 6 个 孔 
径 值 排 秩 . 

b. 利用 a 中 的 秩 , 确定 表 观 孔隙 率 (y) 和 孔径 均值 
(x) 的 秩 相关 性 . 解释 结果 . 


et al. “ Aluminosilicate refractories 


c. 进行 正 的 秩 相关 性 检验 ,用 a = 0.01. 

15.50 生物 识别 方法 的 评价 . 生物 技术 已 经 开发 用 
于 检测 和 验证 个 体 身份 , 这 些 方法 是 基于 诸如 面 
部 特征 、 眼 虹膜 结构 、 指 纹 、 声 音 、 手 形 和 步 法 生 
理学 特征 ( 称 为 生物 签名 ). 在 Chance (2004 年 冬 
AR) 对比 了 4 种 生物 识别 算法 ,将 所 有 4 种 算法 
均 用 于 1196 个 生物 签名 并 获得 “匹配 "得 分 . 为 每 
个 可 能 的 算法 对 ,确定 匹配 得 分 之 间 的 斯 皮尔 曼 
相关 ， 秩 相关 性 矩阵 如 下 . 解释 此 结果 . 


OO 





方 法 I I M N 
I 1 0. 189 0.592 0.340 
IH 1 0.205 0.324 
H 1 0.314 
NW 1 





15.51 因特网 的 组 织 用 途 . 来 自 英国 和 德国 的 研究 
人 员 试 图 开发 组 织 因特网 用 途 ( OIU ) 的 理论 基础 
度量 , 并 将 他 们 的 结果 发 表 在 Internet Research 
( Vol. 15, 2005). 利用 从 77 个 网 站 收集 的 样本 数 
据 , 他 们 调查 在 OIU 水 平 (用 7 个 点 的 标 度 测量 ) 
和 某 些 基于 指标 的 观测 . 几 个 指标 的 斯 皮尔 曼 秩 相 
关系 数 (及 关联 的 p 值 ) 列 于 下 表 . 











JE AR 32 F 637 
_ 与 OIU 水 平 的 相关 性 退火 时 间 x( min) 钝 化 电势 y(mV) 
r, p f& 10 -408 
导航 性 0. 179 0. 148 20 -400 
事务 处 理 数量 0. 334 0.023 45 -392 
定位 性 0. 590 0. 000 20 -379 
信息 丰富 性 -0.115 0. 252 120 -385 
文件 数量 0.114 0.255 资料 来 源 : Chattoraj, L , et al. “Polarization and resistivity 


资料 来 源 : Brock, J. K. ，and Zhou, Y. "Organizational use 
of the internet. " Internet Research, Vol. 15, No. 1, 2005( 3 
IW. 


a. 解释 表 中 给 出 的 每 个 ~ 值 . 
b. 解释 表 中 给 出 的 每 个 p 值 . (用 a = 0. 10 进行 每 
个 检验 . ) 

15.52 丰 辆 堵塞 研究 . 参考 练习 10.6, Journal of 
Engineering for Industry(1993 年 8 月 ) 自 动 化 仓库 的 
研究 . 记录 下 模拟 的 自动 化 仓库 车 辆 数量 的 改变 和 
堵塞 时 间 ( 一 辆 车 被 别 的 车 阻挡 的 总 时 间 ) ,数据 
列 在 下 表 中 . HL ERSTE a = 0. 05 时 检验 堵 
塞 时间 (y) 与 车 辆 数 (*) 之 间 的 相关 性 . 


一 Co 





车 辆 数 TE SEI [8] 车 辆 数 堵塞 时 间 

1 0 9 0.02 
2 0 10 0.04 
3 0. 02 H 0.04 
4 0.01 12 0.04 
5 0.01 13 0. 03 
6 0.01 14 0.04 
7 0.03 15 0.05 
8 0.03 








资料 来 源 : Pandit, R. , and Palekar, U. S. , “ Response 
time considerations for optimal warehouse layout desing. " 
Journal of Engineering for Industry, "Transactions of the 
ASME, Vol. 115, Aug. 1993, p. 326( 4:2). 


15.58 合金 的 电阻 率 . 参考 练习 10. 62, Corrosion 
Science ( 1993 年 9 H ) XFA Ja 3E ta FE Ek - Wy - 
硅 合金 的 电阻 率 研究 . 5 种 合金 样品 在 700% 下 退 
K, 每 种 有 不 同 的 时 间 长 度 . 然后 测量 每 种 样品 的 
的 钝 化 电势 一 一 一 种 结晶 合金 电阻 率 度量 ， 试 验 
数据 列 在 下 面 . 


measurements of post-crystallization changes in amorphous Fe- 
B-Si alloys. " Corrosion Science, Vol. 49, No. 9, Sept. 1993, 
p. 712( && 1). 


a 计算 退火 时 间 (x) 和 钝 化 电势 (y) 之 间 的 斯 皮尔 
曼 相 关系 数 . 解释 结果 . 

b. 利用 a 中 结果 , 检验 退火 时 间 和 钝 化 电势 间 的 
显著 相关 性 . 利用 = =0. 10. 


15.54 新 的 炼 铁 工 艺 . 参考 练习 10.21 , Mining En- 


gineering( 2004 年 10 月 ) 新 的 炼 铁 技术 研究 ， 比较 
小 规模 工厂 试验 生产 与 试验 室 熔炉 试 生产 的 炭 含 
BL. 25 个 厂 试验 的 数据 记录 在 下 表 中 , 进行 非 参数 
检验 确定 试验 工厂 和 试验 室 熔 炉 中 生成 的 炭 含 量 
是 否 有 正 相关 关系 , 用 a 20.01 来 检验 . 


KRED) KEEA) 





试验 工厂 ”试验 室 熔 炉 | 试验 工厂 RERED 

1.7 1.6 3.4 4.3 
3.1 2.4 3.2 3.6 
3.3 2.8 3.3 3.4 
3.6 2.9 3.1 3.3 
3.4 3.0 3.0 3.2 
3.5 3.1 2.9 3.2 
3.8 3.2 2.6 3.4 
3.7 3.2 2.5 3.3 
3.5 3.3 2.6 3.2 
3.4 3.3 2.6 3.1 
3.6 3.4 2.4 3.0 
3.5 3.4 2.6 2.7 
3.9 3.8 








资料 来 源 : Hoffman, G. , and Tsuge, O. * ITmk3——— Appli- 
cation of a new ironmaking technology for the iron ore mining 
industry. " Mining Engineering, Vol. 56, No. 9, Oct. 2004 
(图 8). 
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15.55 铜 管 的 热 性 能 . 参考 练习 10. 12 用 于 制冷 加 
工业 的 整体 散热 管 热 性 能 模型 ( Journal of Heat 
Transfer, 1990 年 8 H ). 表 中 的 数据 是 24 个 整体 散 
热管 未 涌 入 区 域 比 (x) 和 热 传 递 提高 量 (y) 的 记录 
值 ,对 热 传 递 提高 量 (y) 和 未 涌 人 域 比 (*) 间 的 正 线 
性 关系 进行 非 参数 检验 , 取 a =0. 10. 








未 涌 人 区 热 传 递 提 | 未 涌 人 区 热 传 递 提 
RHE, x 高 量 , y | 域 比 , x 高 量 , y 
1.93 4.4 2.00 5.2 
1.95 5.3 1.77 4.7 
1.78 4.5 1.62 4.2 
1.64 4.5 2.77 6.0 
1.54 3.7 2.47 5.8 
1.32 2.8 2.24 5.2 
2.12 6.1 1.32 3.5 
1. 88 4.9 1. 26 3.2 
1. 70 (4.9 1.21 2.9 
1. 58 4.1 2.26 5.3 
2.47 7.0 2.04 5.1 
2.37 6.7 1. 88 4.6 





资料 来 源 : Marto, P. J. ，et al. " An experimental study of R- 
113 film condensation on horizontal integral-fin tubes. ” Jour- 
nal of Heat Transfer , Vol. 112, Aug. 1990, p. 763( X 2). 


15.56 ABERARAD. 参考 练习 10.13 和 关于 
预 压缩 应 力 x 与 建筑 接 链 平均 抗 前 强度 E( y) 2 lJ 
的 直线 模型 . 为 了 检验 这 个 模型 ,进行 了 一 系列 三 
块 一 组 的 用 灰 浆 茜 合 的 实心 砖 压 力 试验 ( Proceedings 
of the Institute of Civil Engineers, 1990 年 3 月 ). 每 三 
块 一 组 的 预 压缩 应 力 是 变化 的 , 且 记 录 下 刚 失 效 前 
的 最 终 剪 切 负 荷 ( 称 为 抗 剪 强度 ) ,下面 的 表格 列 出 
了 7 组 强度 结果 (N/mm?). 进行 M: B, =0 对 备 择 
假设 H.: 8, >0 的 非 参数 检验 , 用 a =0. 05 检验 . 

三 块 一 组 的 试验 1 2 3 4 5 6 7 

抗 剪 强度 7 

预 压缩 应 力 x 

资料 来 源 : Riddington, J. R. , and Ghazali, M. Z“ Hypothesis 


for shear failure in masonry joints. " Proceedings of the Institute of 
Civil Engineers, Part 2, Mar. 1990, Vol. 89, p. 96( Ë] 7). 


理论 练习 

15. 57 对 于 ”=3 的 特殊 情况 , 证 明 ， -Izr, xl. 
(提示 : 列 出 对 x 和 y 排 秩 的 3! x3! =36 种 所 有 
不 同 的 排列 , 并 计算 每 个 的 +. ) 

15.58 对 于 ”=3 的 特殊 情况 , 证 明 E(x ) =0. (对 
于 一 般 情况 , 这 个 事实 也 成 立 . ) (提示 : 利用 理论 
练习 15. 57 的 结果 以 及 任 一 种 排列 发 生 的 概率 均 
为 1/36 的 事实 . ) 


1.00 2.18 2.24 2.41 2.59 2.82 3.06 
0 0.60 1.20 1.33 1.43 1.75 1.75 








快速 回顾 
重要 公式 
检 验 检验 统计 量 大 样本 近似 
符号 $= 大 于 (或 小 于 ) 假 设 的 中 位 数 ro 的 样本 测量 值 个 数 z-i 
T _m(m +n, +1) 
威 尔 科 克 森 秩 和 T, = 样本 1 的 秩 和 或 7, = 样本 2 的 秩 和 z=—— —— — 1 
nyn (ni +n, 41) 
N 12 
T _n(n+1) 
REPERA E Pk T. = 负 的 秩 和 或 了 ，= 正 的 秩 和 2Z=— 4_ 
/n(n+1)(2n+1) 
` 24 
; 12 T? 
TUBE - 沃 里 斯 "nea s 3D 
弗 里 德 曼 F, = Y AG) 





bk(k + 1) 
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( 续 ) 
É 验 检验 统计 量 大 样本 近似 
6Yyd 
斯 皮尔 昌 秩 相关 II dat 
(简化 公式 ) 这 里 di = 样本 1 和 样本 2 第 i 个 观测 值 的 秩 的 关 
TIT C= ODRE y, -的 个 数 ) + (1) GERE y, = y, 的 个 数 ) 
符号 汇集 

# 5 Boo" 

T(tau) 总 体 中 位 数 

s 符号 检验 的 检验 统计 量 ( 见 重要 公式 ) 

T, 样本 ; 中 观测 值 的 秩 和 

T, 威 尔 科 克 森 秩 和 下 侧 临 界 什 

T, 威 尔 科 克 森 秩 和 上 侧 临界 值 

T, 配对 观测 值 正 差 的 秩 和 

T BLXDRBI EE fi 22 98cm 

T, 威 尔 科 克 森 符号 秩 检 验 的 临界 值 

H 克 重 赛 - 沃 里 斯 检验 的 检验 统计 最 ( 见 重要 公式 ) 

F, 弗 里 德 曼 检验 的 检验 统计 量 ( 见 重要 公 趟 ) 

斯 皮尔 曼 秩 相关 系数 ( 见 重要 公式 ) 

p(rho) 总 体 相关 系数 

c 泰 尔 零 斜率 检验 的 检验 统计 量 ( 见 重要 公式 ) 

一 一 一 **eh*mumesitm( emas — — 
本 章 总 结 提示 


° 分 布 自由 检验 一 一 不 依赖 于 抽样 总 体 概率 分 布 的 假定 . 
° 非 参 数 一 一 基于 秩 统 计量 的 分 布 自由 检验 . 

° 总 体 中 位 数 单个 样本 的 非 参数 检验 一 符号 检验 

* 配对 非 参数 检验 一 一 威 尔 科 克 森 秩 检 验 . 

° 完全 随机 化 设计 的 非 参 数 检验 一 一 克 重 赛 - 沃 里 斯 检验 . 
° 随机 化 区 组 设计 的 非 参 数 检验 一 一 弗 里 德 曼 检验 

° 秩 相关 性 的 非 参 数 检验 一 一 斯 皮尔 曼 检 验 

° 零 儿 率 的 非 参数 检验 一 一 泰 尔 C 检验 . 








补充 应 用 练习 

15.59 ZTA, Journal of the American Mos- 
quito Control Association ( 1995 年 3 月 ) 刊 登 了 某 种 
苍蝇 叮咬 率 的 研究 文章 ,叮咬 率 定义 为 在 15 min 
紧 露 期 间 叮 咬 一 名 志愿 者 的 苍蝇 个 数 . 已 知 在 犹他 
州 斯 坦 伯 里 岛 这 种 苍蝇 的 中 位 叮咬 率 为 每 15 min 5 
次 . 然而 理论 上 在 明亮 的 晴天 , 苍蝇 的 叮咬 率 会 高 


些 . 为 了 验证 这 个 理论 ，122 名 志愿 者 在 斯 坦 伯 里 

岛 阳光 明媚 的 一 天 暴露 于 蝇 群 , 在 这 些 志 愿 者 中 ， 

95 名 志愿 者 经 历 了 大 于 S 次 的 叮咬 率 . 

a 建立 此 检验 的 原 假设 和 备 择 假设 . 

b. 计算 检验 的 近似 p 值 . (提示 ; 利用 二 项 概率 的 
正 态 近似 . ) 

e. 当 a 20.01 时 给 出 合理 的 结论 . 
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15.60 苍蝇 的 叮咬 率 ( 续 ). 参考 练习 15.59, Jour- 
nal of the American Mosquito Control Association 中 苍 
蝇 叮 咬 的 研究 . RREKET 6 种 风速 情况 下 
研究 以 km/h 计 的 风速 对 斯 坦 伯 里 岛 巷 蝇 叮 咬 率 的 
影响 . 用 克 鲁 赛 - 沃 里 斯 检验 比较 6 种 风速 下 叮咬 
率 的 分 布 . 6 种 条 件 下 的 叮咬 率 的 秩 和 如 下 表 . 





风速 (km/h) ”志愿 者 人 数 (n;) ”叮咬 率 秩 和 (RR;) 

<1 11 1 804 
1~2.9 49 6 398 
3~4.9 62 7 328 
5~6.9 39 4 075 
7-8.9 35 2 660 
9 -20 21 1 388 
总 和 217 23 653 





资料 来 源 : Strickman, D. , et al.“ Meteorological effects on 
the biting activity of Leptoconops americanus ( Diptera; Cerato- 
pogonidae ) . " Journal of the American Mosquito Control Associ- 
ation, Vol. I, No. 1, Mar. 1995, p. 17( € 1). 


a BERE A 3 g h RREA Bt H -35.2, 验证 这 
^ B. 

b. Xf a 20.01, 求 检 验 的 拒绝 域 . 

c. 给 出 合理 的 结论 . 

d. 研究 人 员 报 告 此 检验 的 p 值 小 于 0.01, 这 个 值 
支持 c 中 的 结论 吗 ? f. 

15.61 HERE. 参考 练习 7. 106, 进行 试验 确定 风 

二 的 落 铃 棉 营 提 取 物 (GBE) 对 非 接 尘 工厂 工人 细 

胞 的 影响 ( Environmental Research, 1986 年 2 H). 

用 不 同 的 CBE v BESEHEREB B 6 ATARI, 

并 测量 每 个 血液 样本 的 周期 AMP 水 平 (每 百 万 细 

胞 的 兆 摩 尔 ) , 两 个 GBE 浓度 0 mg/mL( 盐 水 缓冲 

剂 ) 和 0.2 mg/mL 的 数据 复制 在 下 表 . 进行 检验 发 

现 两 个 GBE 浓度 的 周期 AMP 水 平分 布 在 位 置 上 的 

移动 , 用 a=0.10 检验 . 





E A n PER) ; 
A 8.8 4.4 

B 13.0 5.7 

C 9.2 4.4 
"D 6.5 4.1 








(A) 
CBE 浓度 ( mg/mL) 
+ A 0 0.2 
F 9.1 4.4 
17.0 7.9 
资料 来 源 : Butcher, B. T. , Reed, M. A. , and O' Neil, C. 
E. , "Biochemical and immunologic characterization of cotton 


bract extract and its effect on in vitro cyclic AMP production. " 
Environmental Research , Vol. 39, No. 1, Feb. 1986. 


15.62 下 水 管道 的 破裂 强度 . 一 个 城市 的 建筑 物 规 


格 要 求 用 于 居民 区 的 下 水 管道 破裂 强度 的 中 位 数 
要 大 于 每 直线 英尺 2 500 Ib. 一 个 希望 为 城市 提供 
下 水 管道 的 生产 商 投 标 且 提供 下 面 的 附加 信息 . 一 
个 独立 承包 人 随机 选择 生产 商 的 7 根 管道 且 检 验 
每 根 的 破裂 强度 , 结果 (每 直线 英尺 磅 ) 为 


一 一 -一 一- 
2610 2750 2420 2510 2540 2490 2680 
———————M———Ó———U o: D. 


有 充分 证 据 表明 生产 商 的 下 水 管道 符合 要 求 的 规 
格 吗 ? 用 显著 性 水 平 a =0. 10. 


15.63 行为 评价 训练 . Personnel Psychology (1984 年 


8 月 ) 评 估 了 一 个 机 构 安 排 下 ,行为 评价 训练 的 有 
效 性 . 随机 选择 中 等 水 平 的 管理 人 员 并 将 他 们 指派 
到 三 个 训练 环境 中 的 一 个 : 没有 训练 、 计 算 机 辅助 
训练 和 计算 机 辅助 训练 外 加 行为 模型 专题 讨论 会 . 
在 正式 训练 后 , 向 管理 人 员 提 出 测验 管理 知识 的 
25 道 多 项 选择 题 , 记录 每 个 人 的 正确 回答 个 数 , 下 
表 中 的 数据 摘自 这 篇 文章 的 汇总 信息 . 能 提供 充分 
证 据 表明 三 种 行为 评估 训练 下 得 分 的 相对 频率 分 
布 在 位 置 上 不 同 吗 ? 用 a =0. 01 检验 . 





i 计算 村 FAAEA 
BAWA C 辅助 训练 加 专题 讨论 会 
16 19 12 
18 22 19 
11 13 18 
14 15 22 
23 20 16 
18 25 
21 


15.64 酸雨 研究 . 参考 练习 14.65, 酸雨 对 自然 生态 


系统 中 土壤 酸度 的 影响 研究 . 试验 田 用 两 种 不 同 
pH 值 3.7 和 4.5 的 酸雨 灌溉 , 在 3 种 不 同 深度 : 
0~15 em, 15 ~30 em, 30 ~46 em, 测量 了 土壤 的 酸 


非 参 数 统计 
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ER, 试验 是 在 三 个 不 同 的 时 段 进行 的 , 所 得 的 土壤 
pH 值 列 在 下 表 中 . 试验 的 主要 目的 是 对 比 用 pH 值 
为 4.5 和 3.7 的 酸雨 灌溉 的 土壤 的 酸度 . 
4 月 3 日 6 月 16 日 6 月 30 日 
酸雨 pH ”酸雨 pH 酸雨 pH 
3.7 4.5 3.7 4.5 3.7 4.5 





0~15cm 5.33 5.33 5.47 5.47 5.20 5.13 
La 15 ~30 cm 5.27 5.03 5.50 5.53 5.33 5.20 
30-46 cm 5.37 5.40 5.80 5.60 5.33 5.17 
资料 来 源 :“Acid rain linked to growth of coal-fired power. " 
Florida Agricultural Research 83, Vol. 2, No. 1, 
Winter 1983. 
a. 利用 非 参数 检验 比较 4 月 3 日 两 个 处 理 的 土壤 
pH. | 
b. 利用 非 参 数 检验 比较 6 月 16 日 两 个 处 理 的 土壤 
pH 值 . 
c. 利用 非 参数 检验 比较 6 月 30 日 两 个 处 理 的 土壤 
pH 值 . 
d. 评价 a~e 中 检验 的 有 效 性 . 
15.65 玉米 的 霉菌 感 数 . 黄 曲霉 毒素 的 蔓延 对 农民 
成 为 一 个 有 关 干 旱 的 严重 问题 , 黄 曲 霉 毒素 是 一 种 
由 霉菌 产生 的 高 度 有 毒物 质 , 这 种 物质 会 传染 玉米 
地 , 在 较 高 污染 水 平 下 , 黄 曲 霉 毒素 对 动物 和 人 类 
的 健康 有 潜在 的 危险 . (食品 及 药物 管理 局 的 官方 设 
定 州 际 市 场 黄 曲 霉 毒 素 的 最 高 限量 10 亿 分 之 20 是 
安全 的 . ) 研 究 了 三 种 喷雾 液 A. B 和 C 来 控制 玉米 
地 里 的 黄 曲霉 毒素 . 为 了 确定 三 种 喷雾 液 作用 是 否 
存在 不 同 , 从 污染 的 玉米 地 里 随机 选择 10 畦 玉米 
地 , 将 每 畦 分 成 3 块 等 同 的 面积 , 然后 给 每 块 玉米 
地 随机 指派 喷雾 液 , 这 样 建立 了 一 个 随机 化 区 组 设 
YF, 下 面 的 表格 给 出 了 喷射 喷雾 后 出 现在 玉米 样本 
的 黄 曲霉 毒素 含量 (10 亿 分 之 一 ). 用 弗 里 德 曼 检验 
判断 对 三 种 喷雾 液 出 现 的 黄 曲霉 毒素 含量 的 概率 分 
布 是 否 有 差异 , 在 显著 性 水 平 a =0. 05 检验 . 











WO Wk DES 
HË A B C 上 RE A B C 
1 21 23 15 6 5 12 6 
2 2 30 21 7 18 18 12 
3 16 19 18 8 26 ` 32 21 
4 20 19 18 9 17 20 9 
5 13 10 14 | 10 4 10 2 


15.66 ihe 4 AAE. 参考 练习 10. 68, Lubrication 


Engineering ( 1986 年 4 月 ) 中 评价 原油 的 热 氧 化 稳 
定性 的 方法 研究 . 对 10 种 原油 的 样本 , 用 TG 技术 
确定 氧化 点 形成 的 氧化 化 合 物 的 量 , 由 标准 方法 
确定 氧化 产品 的 总 百分比 , 下 表 给 出 了 试验 结果 . 
数据 能 提供 充分 证 据 表 明 两 种 方法 的 氧化 物 测量 
值 具 有 正 的 秩 相 关 性 吗 9 用 o -0.01 检验 . 





原油 TG 技术 标准 方法 
氧化 物 含量 (% ) 总 氧化 物 (% ) 
1 25.4 2.3 
2 27.11 2.5 
3 28.0 2. 65 
4 17.9 1.3 
5 18.9 1. 45 
6 22.9 1.9 
7 30.8 3.3 
8 18.6 1.4 
9 24.4 2.1 


10 29.8 2.9 
A 
资料 来 源 : Abou El Naga, H. H. , and Salem, A. E. M. 


"Base oils thermooxidation. ” Lubrication Engineering, Vol. 
24, No. 4, Apr. 1986, p. 213. 由 美国 润滑 工程 师 学 会 允许 
SED. 版 权 所 有 . 


15.67 空气 微粒 中 的 放射 物 . 为 了 建立 关于 放射 物 


的 准则 , 政府 机 构 定期 监测 核电 站 , 这 些 准则 能 发 
现 来 自 可 能 危害 周围 环境 操作 的 任何 变化 . 健康 和 
康复 服务 部 (DHRS ) 监视 佛罗里达 3 个 核电 站 空气 
微粒 中 的 放射 物 , 下 表 的 数据 表示 [平均 贝塔 总 值 
( pCi/m) (一 种 放射 性 空气 微粒 的 度量 ) ] 的 每 个 
工厂 和 奥兰多 控制 站 在 10 周 内 记录 的 . 

周 奥兰多 土耳其 角 圣 卢 西 亚 唱 河 





1 0.048 0.023 0.023 0.041 
2 0.019 0.025 0.020 0. 032 
3 0. 022 0. 026 0. 022 0. 025 
4 0. 015 0. 026 0. 028 0. 027 
5 0. 027 0. 034 0. 031 0. 030 
6 0. 122 0. 035 0. 025 0. 033 
7 0.013 0. 033 0. 020 0. 080 
8 0. 007 0. 022 0. 022 0. 026 
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(È) 
8 奥兰多 土耳其 角 圣 卢 西亚 Gkal 
9 005 0.021 0.013 0.015 
10 0.05 | 0.02 0.026 0. 042 


资料 来 源 :“ Monitoring of nuclear power plant environs in 

Florida:1978-79. "Dept. of Health and Rehabilitative Serv- 

ices , Health & Technical Support Services , Radiological Health 

Services. 

a 数据 能 提供 充分 证 据 表明 在 4 个 佛罗里达 站 点 空 
气 微粒 的 放射 物 有 差异 吗 ? 用 a = 0. 05 检验 . 

b. 数据 能 提供 充分 证 据 表明 在 晶 河 站 点 和 奥兰多 
控制 站 点 空气 微粒 的 放射 性 有 差异 吗 ? 用 
a 20.05] 35. 

15.68 多 块 状 铁 矿 五 . 智利 多 块 状 铁 矿 石 (95% 颗 

粒 大 小 , 150 mm) 货 舱 样 品 是 来 自 一 稻 35 325 长 吨 

整 船 矿石 的 随机 样本 ; 确定 每 种 样品 中 铁 的 百 分 

HE ( Reports of Statistical Application Research , Union of 

Japanese Scientists and Engineers, Vol. 18, 1971). 

10 个 货船 样品 的 数据 如 下 . 


63.01 61.75 63.22 62. 38 62. 80 
63. 92 62. 94 63. 71 62.10 64. 34 


有 充分 证 据 表明 来 自 整 船 矿石 的 货舱 样品 的 铁 含 
量 中 位 百分比 不 等 于 63 吗 ? 用 o =0. 05 检验 . 
15.69 飞机 空调 系统 的 寿命 长 度 . 在 20 世纪 60 年 代 
初期 ， 波 音 720 喷气 式 飞机 的 空调 系统 处 于 研发 中 ， 
下 表 给 出 了 两 架 不 同 的 波音 720 飞机 空调 系统 的 寿 
MKE). 假定 数据 是 表示 各 自 总 体 的 随机 样本 ， 
能 说 明 两 架 波音 720 飞机 空调 系统 的 寿命 长 度 分 布 
在 位 置 上 有 移动 吗 ? 用 a =0. 05 检验 . 





飞机 1 飞机 2 
23 49 59 230 
118 10 32 54 
90 310 14 152 
29 76 102 67 
156 62 66 34 





资料 来 源 : Hollander, M. , Park, D. H. , and Proschan F. 
“Testing whether F is * more NBU’ than is G. ” Microelectron- 
ics and Reliability, Vol. 26, No. 1, 1986, p. 43(3€ 1). 专利 
1986. Pergamon 出 版 社 . 允许 重印 . 


15.70 合成 纤维 研究 . 合成 纤维 (如 人 造 丝 、 尼 龙 和 


聚 酯 纤维 ) 约 占 了 美国 工厂 纺织 品 生 产 中 所 用 全 部 
纤维 的 7095. 进行 一 项 试验 ， 比 较 用 两 种 纺 纱 法 ， 
湿 纺 和 干 纺 生产 的 合成 纤维 的 断裂 强度 , 选取 10 
种 不 同 的 合成 纤维 样品 , 每 种 均 被 分 成 两 股 细 丝 ， 
一 股 使 用 湿 纺 法 处 理 , 另 一 股 使 用 干 纺 法 ; 测量 每 
种 细 丝 的 断裂 强度 ( 克 / 但 尼 尔 ) , 并 列 于 下 表 . 表 
中 数据 能 充分 说 明 两 种 方法 生产 的 合成 纤维 有 不 
同 的 断裂 强度 吗 ? 用 a =0. 05 检验 . 





纤维 干 纺 湿 纺 
乙酸 1.3 1.0 
有 机 玻璃 丝 2.7 2.5 
芳 纶 4.8 4.7 
混纺 纱 2.6 2.8 
尼龙 4.5 4.2 
降 燃 烃 5.9 5.8 
聚 脂 纤维 4.5 4.3 
人 造 丝 1.6 1.1 
氨纶 > 0.7 0.9 
三 乙酸 酯 1.3 0.9 


15.71 电磁 传播 研究 . 参考 练习 10.61, IEEE Trans- 


actions on Electromagnetic Compatibility (1985 年 8 
月 ) 对 站 衰减 (dB) 和 侦 极 传播 频率 (MHz) 的 研究 ， 
数据 复制 在 下 表 . 





传播 频率 x( MHz) 站 衰减 y( dB) 

50 11.5 
100 15.8 
200 18.2 
300 22.6 
400 26.2 
500 27.1 
600 29.5 
700 30.7 
800 31.3 
900 32.6 

1 000 34.9 


———r_--J——— l C ll 


资料 来 源 : Bennett, W. S. “An error analysis of the FCC 
siteattenuation approximation. ” JEEE Transactions on Electro- 
magnetic Compatibility, Vol. EMC — 27, No. 3 , Aug. 1985, 
p. 3C). (91985, IEEE. 
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a. 求 传播 频率 (x) 和 站 衰减 水 平 (y) 之 间 的 斯 皮尔 
曼 相关 系数 , 请 解释 结果 . 

b. 进行 检验 站 衰减 水 平 (y) 与 传播 频率 (x) 是 否 正 
相关 ; 用 a =0. 10 检验 . 

15.72 混凝土 管道 的 径 向 张力 强度 . 下 表 给 出 了 混 

凝 土管 道 径 向 张力 强度 研究 试验 中 得 到 的 部 分 数 

据 , 用 于 试验 的 混凝土 管道 内 径 为 84 in, 壁 厚 大 约 

8. 75 in, 此 外 , 里 面 还 有 冷 拔 钢丝 加 强 . 表 中 显示 

的 是 9 根 管 子 样品 直到 第 一 次 出 现 裂 痕 的 承重 量 

(Ib/ft) 以 及 寿命 (天 ) , 数据 能 提供 充分 证 明 表 明 


承重 量 和 寿命 之 间 的 相关 性 吗 ? 用 a =0. 05 检验 . 





承重 量 寿命 承重 量 寿命 
11 450 20 10 540 25 
10 420 20 9 470 31 
11 142 20 9 190 31 
10 840 25 9 540 31 
11 170 25 








资料 来 源 : Heger, F. J. , and McGrath, T. J. “Radial ten- 


sion strength of pipe and other curved flexural members. " 
Journal of the American Concrete Institute, Vol. 80, No. 1, 
1983, pp. 33-39. 


15.73 ”水温 对 鱼 的 影响 . EPA 希望 判断 由 于 核电 站 
引起 的 海水 温度 改变 是 否 对 生活 在 此 区 域 的 动物 
寿命 有 显著 的 影响 . 将 刚 乳化 的 某 种 鱼 类 样品 随机 
分 成 4 组 , 这 4 组 分 别 放 置 于 水 温 不 同 , 其 他 条 件 
是 完全 相同 的 模拟 海洋 环境 中 . 6 个 月 以 后 , 测量 
这 些 样品 的 重量 . 结果 ( 短 司 ) 由 下 表 给 出 . 数据 能 
提供 充分 证 据 表明 一 种 (或 多 种 ) 温 度 较 之 其 他 温 
度 产 生 更 大 的 体重 增加 吗 ? 用 a = 0. 10 检验 . 





水 温 
38 °F 42°F 46°F 50°F 
22 15 14 17 
24 21 28 18 
16 26 21 13 
18 16 19 20 
19 25 24 21 
17 23 


15.74 i6 £9 X. 石油 生产 者 希望 找到 高 强度 、 


耐 腐蚀 的 镍 合金 . 镍 合金 尤其 易 受 氢 脆 变 的 影响 ， 
氨 脆 变 是 合金 浸入 硫酸 溶液 中 出 现 负极 变化 的 过 
fi. 为 了 评价 两 种 英 康 洛 伊 合金 (800 和 902) 的 性 
BE, 对 每 种 合金 的 电解 渗 握 样品 测量 延展 性 损失 
量 (记录 为 面积 减少 的 百分比 ), 表 中 给 出 每 种 类 
型 8 个 拉 伸 样品 的 测量 值 . 进行 检验 确定 两 种 镍 合 
金 延 展 性 损失 的 概率 分 布 是 否 不 同 . 用 a = 0.05 











合金 800 合金 902 
59.2 66.3 67.2 61.3 
78.8 69.8 46.8 58.7 
79.2 66. 2 50.2 40.9 
75.0 70.7 44.5 55.4 
理论 补充 练习 


( 注 : 这 些 练习 需要 使 用 计算 机 和 计算 机 模拟 技 
HR.) 


15.75 在 这 章 中 略 去 了 各 种 非 参 数 检验 统计 量 零 


分 布 的 理论 推导 , 然而 , 可 以 利用 计算 机 模拟 得 

到 检验 的 近似 拒绝 域 . 考虑 在 n =n, = 10 的 情况 

下 求 威 尔 科 克 森 秩 和 统计 量 的 近似 抽样 分 布 

问题 . 

a. 编写 计 算 机 程序 对 nn =n + n, =20 个 秩 随机 排 
序 并 且 计 算 相 应 的 威 尔 科 克 森 秩 和 T, ,这 个 可 
以 用 随机 数 发 生 器 完成 . 

b. 编写 计算 机 程序 重复 a 中 的 命令 N=1 000 次 . 

c. 构造 N=1 000 4 T, 计算 机 生成 值 的 相对 频率 
分 布 (参考 第 2 章 ), 这 个 模拟 分 布 表示 T, 的 近 
似 抽样 分 布 . 

d. 利用 模拟 的 抽样 分 布 确 定 使 P(T < Tos) = 
0. 05 成 立 的 Too tE, 这 个 值 表示 威 尔 科 克 森 秩 
和 检验 的 a = 0. 05 时 的 单 侧 临 界 值 . 


15.76 按照 练习 15.75 列 出 的 步骤 求 n =10 时 秩 相 


关 性 斯 皮尔 曼 检 验 的 近似 临界 值 (a = 0.05). ( 提 
T: 在 a 中 需要 对 n=10 个 y 秩 和 n=10 个 x 秩 随 
机 排序 . ) 
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活动 中 的 统计 学 : 致命 暴露 一 一 栓剂 与 越南 老兵 

柳 剂 是 美国 武装 部 队 主 要 用 于 热带 气候 而 开发 的 一 种 除草 剂 代号 , 产品 的 目的 是 使 能 隐藏 敌人 
的 树木 和 灌 从 落叶 , 不 让 敌人 藏匿 在 密林 地 形 (代号 来 源 于 作为 存储 除草 剂 桶 的 标记 是 橙色 短 带 ). 20 
世纪 60 年 代 初 期 橙 剂 在 东南 亚 试验 并 且 在 越南 战争 高 峰 期 间 (1967 一 1968 年 ) 广 泛 使 用 ; 在 1971 年 
减少 并 最 终 禁 止 它 的 使 用 . 

ES8JE 484828 2, 4, D 和 2, 4, 5, T 这 两 种 化 表 SIA15. 1 20 名 越南 老兵 TCDD 测量 





学 剂 的 50-50 混合 物 . 混合 后 的 产品 再 与 煤油 或 柴 老兵 脂肪 血脂 | 老兵 脂肪 血脂 
油 混合 并 用 飞机 、 汽车 和 手动 喷雾 器 散播 . 作为 化 1 49 2.5 11 7.0 6.9 
学 生产 过 程 中 无 用 的 副产品 , ARE Hg TCDD 或 2 6.9 3.5 12 1.4 1.6 
二 恶 英 严重 污染 . 对 试验 室 中 动物 进行 测试 , TC- — 3 100 68 13 11.0 20.0 
DD 引起 种 类 繁多 的 疾病 (包括 癌症 ) ,其 中 许多 是 4 4.4 4.7 14 2.5 4.1 
致命 的 . 5 4.6 4.6 15 4.4 2.1 

越南 战争 期 间 , 估计 使 用 了 1 900 5e RERSE 6 Li 1.8 16 4.2 1.8 
坏 覆 盖 在 亚洲 热带 丛林 的 稠密 植物 和 树木 , 由 于 这 7 23 25 17  4LO0 — 360 
种 暴露 , 许多 越南 老兵 的 血液 和 脂肪 组 织 中 含有 高 8 59 3.1 18 2.9 3.3 
度 危险 的 TCDD 水 平 . Chemosphere( Vol. 20, 1990) 刊 9 7.0 3.1 19 7.7 7.2 
登 了 关于 20 AH ERRETES ST 38 JM Ri e 10 5.5 3.0 20 2.5 2.0 








兵 的 TCDD 水 平 的 报告 , 表 SIA15. 1 给 出 了 20 名 老 资料 来 源 : Schecter, A. , et al. “Partitioning of 2,3,7,8- 
兵 的 血 脂 和 脂 肪 组 织 中 TCDD 含量 ( 万 亿 分 之 一 ) ; chlorinated dibenzo-p-dioxins and dibenzofurans between adi- 
Í 、 pose tissue and plasma lipid of 20 Massachusetts Vietnam veter- 
这 些 数据 存储 在 TCDD 文件 中 . 数据 能 告诉 我 们 越 ans. ” Chemosphere, Vol. 20, No. 7 -9, 1990, pp. 954 -955 
南 老兵 脂肪 和 血脂 中 TCDD 水 平 的 哪些 信息 ? 脂肪 RIA). 

和 血脂 的 TCDD 水 平 之 间 有 关系 吗 ? 对 于 这 个 活动 中 统计 学 , 利用 本 章 介绍 的 非 参数 检验 来 回答 这 
些 以 及 其 他 相关 问题 . 

某 些 医学 研究 人 员 认 为 万 亿 分 之 三 (ppt) 的 
TCDD 水 平 就 是 高 度 危 险 的 , 表 SIA15. 1 中 的 数 
据 能 提供 证 据 表 明 越 南 老 兵 血 脂 和 脂肪 组 织 芯 N Below Equal Above we Median 
TCDD 中 位 水 平 超过 3ppt B? 为 了 回答 这 个 问 FAT 20 6 0 i4 0.0977 4.750 

B PLASMA 20 7 1 i2 5.1196 3.200 
题 , 对 数据 运用 符号 检验 ,图 SIA15.1 给 出 了 —— 
MINITAB 输出 . 图 SIA15. 1 TCDD 数据 的 MINITAB 符号 检验 

对 于 脂肪 中 的 TCDD 和 血脂 中 的 TCDD 这 两 个 变量 , 想 要 检验 Ho: 7=3, 对 :7 >3. 根据 输 
tH, 20 名 越南 老兵 中 14 人 的 脂肪 TCDD 水 平 高 于 3ppt, 20 名 越南 老兵 中 12 人 的 血脂 TCDD 水 平 
高 于 3ppt. 从 而 , 两 个 检验 统计 量 分 别 是 $=14 和 5 -12, 检验 的 双 侧 p 值 (输出 中 着 重 显 示 ) 分 别 
Æ 0. 0577 和 0.1796. FÆ, 相应 的 单 侧 p 值 0.0577/2 = 0. 0288 和 0. 1796/2 = 0. 0898. 

在 a=0.10 下 , 两 个 检验 都 是 显著 的 ; 但 是 在 o = 0.05 BJ, 血脂 中 TCDD 的 检验 不 显著 . 所 以 ， 
数据 提供 充分 证 据 表明 脂肪 的 TCDD 水 平 中 位 数 超过 3ppt; 但 是 , 对 于 血脂 中 TCDD 水 平 的 证 据 不 
是 很 充分 . 

为 什么 对 数据 使 用 非 参 数 符号 检验 而 不 是 更 熟悉 的 学 生 上 检验 呢 ? 图 SIA15. 2 中 MINITAB 直方 
图 阐述 了 这 个 问题 . 很 明显 , 样本 的 TCDD 水 平 是 非 正 态 分 布 , 从 而 , 违背 了 上 检验 能 给 出 有 效 推断 





Sign Test for Median: FAT, PLASMA 


Sign test of median = 3.000 versus > 3.000 
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所 要 求 的 假定 . 
Histogram of FAT, PLASMA 
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图 SIA15.2 TCDD 数据 的 MINITAB 直方 图 








Test 


DIFF 





Wilcoxon Signed Rank Test: DIFF 


of median = 0.000000 versus median not = 0.000000 
N 
for Wilcoxon Estimated 
N Test Statistic P Median 
20 19 140.0 0.073 12175 








图 SIA15.3 TCDD 数据 的 MINITAB 符号 秩 检验 


医学 研究 人 员 对 于 比较 越南 老兵 脂肪 组 织 和 血脂 中 的 TCDD 水 平 同样 感 兴趣 . 特别 地 , 想 要 确 
定 脂肪 中 的 TCDD 水 平分 布 是 否 移动 位 于 血脂 中 的 TCDD 水 平分 布 的 左边 或 右边 . 为 了 回答 这 个 问 
题 , 首先 注意 数据 是 配对 收集 的 一 一 对 于 样本 中 的 每 个 越南 老兵 , 研究 人 员 记 录 了 脂肪 和 血脂 中 的 
TCDD 水 平 . 所 以 , 正确 的 检验 是 威 尔 科 克 森 符 号 秩 检验 , 图 SIA15. 3 给 出 了 分 析 的 MINITAB 输出 . 

检验 统计 量 和 7p 值 都 在 输出 中 着 重 显示 . 因为 p fB =0.073, 所 以 在 a=0.05 下 没有 充分 证 据 表 
明 脂 肪 中 TCDD 水 平分 布 与 血脂 中 TCDD 水 平分 布 不 同 . (注意 : 图 SIA15.4 给 出 的 脂肪 中 TCDD 水 
平和 血脂 中 TCDD 水 平 差 的 直方 图 表明 样本 差 不 像 来 自 一 个 正 态 分 布 . ) 


Frequency 








Histogram of DIFF 
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图 SIA15.4 TCDD 水 平 之 差 的 MINITAB 直方 图 
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检查 脂肪 与 血脂 中 TCDD 水 平 之 间 关系 的 另 一 种 方法 是 求 脂 肪 组 织 中 TCDD 水 平 与 血脂 中 TC- 
DD 水 平 相关 性 的 估计 量 . 因为 两 个 变量 不 是 正 态 分 布 , 所 以 用 斯 皮尔 曼 秩 相关 法 ,图 SIAS. 5 给 出 
了 分 析 的 SPSS 输出 ,7x, 的 值 (输出 中 着 重 显示 ) 是 0.774; 于 是 , 越南 老兵 样本 中 脂肪 与 血脂 的 TCDD 
水 平 之 间 看 来 有 相当 强 的 正 相 关 性 . 单 侧 检 验 的 p 值 (同样 着 重 显 示 ) 是 0.000, 表明 存在 充分 证 据 
(a =0.01) 两 个 TCDD 测量 值 之 间 有 正 相关 性 . 


Correlations 









Spearman's rho FAT Correlation Coefficient 


Sig. (1-tailed) 
N 











PLASMA Correlation Coefficient 
Sig. (1-tailed) 
N 





*. Correlation is significant at tne 0.01 level (1-tailed). 


图 SIA15.5 TCDD 数据 的 SPSS 斯 皮尔 曼 秩 相关 检验 


第 16 章 统计 过 程 和 质量 控制 
目标 “为 监测 工业 产品 的 质量 以 及 控制 销售 给 消费 者 的 产品 质量 提供 一 些 统计 方法 


16.1 全 面 质量 管理 


当 考 虑 产品 或 服务 质量 时 , 我 们 期 望 该 产品 具有 一 组 特征 . 例如 ， 我 们 希望 电灯 泡 的 寿命 更 长 ， 
纸巾 更 加 结实 、 更 易 吸 水 ,服务 等 待 时 间 适 度 缩短 ,1/4 磅 的 汉堡 包 至 少 要 有 1⁄4 WE. 但 是 生产 一 
件 合格 产品 并 不 是 一 件 容 易 的 事情 ， 原材料 特性 和 工艺 的 变异 会 引起 产品 质量 的 变异 , 在 自动 生产 
线 上 生产 出 来 的 一 个 灯 泡 的 寿命 与 几 秒 钟 之 后 生产 出 来 的 另 一 个 灯泡 的 寿命 可 能 会 有 显著 不 同 . 类 
似 地 , 一 台 造 纸 机 上 生产 的 纸张 强度 随时 间 不 同 而 变化 ， 这 是 因为 进入 机 器 纸浆 特性 的 变异 . 所 以 ， 
制造 商 监测 他 们 生产 的 产品 质量 是 非常 重要 的 . 

现在 , 美国 商业 领导 者 正在 推广 全 面 质 量 管理 (TQM ) 的 概念 . 如 图 16. 1 所 示 , TOM 有 三 个 重 
要 的 组 成 部 分 : (1) 概念 ; (2) 系统; (3) 工具. TQM 的 概念 包括 围绕 全 面 质量 运动 的 许多 思想 , 这 些 
包括 顾客 满意 、 所 有 工作 是 一 个 过 程 、 用 数据 说 话 和 上 游 管理 . (用 数据 说 
话 对 这 个 问题 是 一 个 特别 贴切 的 概念 ， 因为 它 与 测量 和 监测 过 程 变量 有 
X.) 

第 二 部 分 是 系统 , 与 系统 管理 的 概念 有 关 . 公司 的 所 有 者 必须 认真 负责 地 
管理 诸如 综合 管理 、 市 场 创新 、 产 品 创新 和 产品 供应 之 类 的 系统 . 

最 后 , 在 执行 TQM 计划 时 , 还 有 几 个 可 供 使 用 的 工具 . 这 些 工 具 包 括 图 16.1 TQM 的 组 成 
流程 图 、 因 果 图 和 统计 过 程控 制图 . 

图 16. 1 中 的 三 个 部 分 对 于 在 一 个 公司 成 功 地 执行 TQM 体系 是 必 不 可 少 的 . 本 章 主 要 关 
E TOM 统计 过 程控 制 元 素 , 统计 过 程控 制 (SPC) 使 工程 师 通 过 控制 图 来 理解 和 监测 过 程 
变异 . 


16.2 计量 控制 图 


虽然 在 美国 商业 中 TOM 是 最 近 的 趋势， 但 是 用 控制 图 来 监测 过 程 数据 的 思想 在 1924 年 就 由 休 
哈 特 (Shewhart ) 提出 . 控制 图 是 由 一 系列 描绘 产品 质量 在 时 间 上 变化 的 图 所 构成 ， 如 图 16. 2 所 示 . 图 
中 变量 既 可 以 是 定量 特征 (如 吊环 螺栓 的 直径 ) ， 也 可 以 是 工业 产品 的 定性 属性 (如 有 缺陷 或 无 缺陷 
的 灯泡 ). 这 种 简单 图 的 作用 在 于 它 可 以 区 分 产品 质量 特征 的 两 类 变异 . (1) 可 查 明 原因 的 变异; (2) 
随机 变异 . 

定义 16. 1 ”质量 变量 的 控制 图 是 将 随时 间 测 量 值 定期 标 出 而 得 到 的 . 

可 查 明 原 因 的 变异 是 诸如 金属 切割 机 的 磨损 、 砂 轮 磨损 、 生产 区 湿度 和 温度 的 变化 、 工 人 的 疲 
劳 等 引起 的 . 切割 机 刀口 、 研磨 剂 表面 的 磨损 或 环境 变化 的 影响 通常 是 随 着 时 间 的 过 去 通过 特征 逐 
渐变 化 趋势 显现 的 ( 见 图 16.2a). 相反 ， 原材料 常常 会 产生 质量 特征 水 平 上 的 突然 变化 ( 见 图 
16. 2b). 在 出 现 变异 时 ， 质量 控制 和 生产 工程 师 要 努力 识别 质量 特征 的 趋势 或 者 突然 变化 ， 修正 生 
产 过 程 来 减少 或 消除 这 类 变异 . . 


























648 第 16 € 





即使 在 说 明 可 查 明 原因 的 变异 时 , 作为 产品 质量 特征 的 测量 值 是 随时 间 以 随机 方式 变化 的 . 第 
二 类 变异 , 即 随机 (或 机 会 ) 变 异 是 由 原 材 
料 、 工 人 行为 等 的 瞬间 随机 变化 引起 的 . 





因为 某 种 偶然 原因 的 稳定 系统 是 任何 生产 H eor B. 
过 程 中 国有 的 , 所 以 这 种 类 型 的 变异 看 作 Ë son RE 
为 过 程 的 正常 变异 . 当 一 件 产品 的 质量 特 LLLUCLITLLELILELLLLLLELLE LELLELLELLEIRILLLELLILLIILIIL 
征 仅仅 受 随 机 变异 支配 时 ,就 称 过 程 是 时 间 时 间 
=. 2) i3 b) 突然 变化 
定义 16.2 度量 产品 质量 特征 的 变 图 16.2 表明 可 查 明 原 因 变 异 的 质量 特征 图 


量变 异 是 由 于 可 查 明 原因 的 变异 或 者 随机 
(机 会 ) 变 异 引 起 的 . 

定义 16.3 当 产 品 的 质量 特征 仅仅 受 随机 变异 支配 时 , 就 称 生 产 过 程 是 受 控 的 , 否则 称 过 程 是 
失控 的 . 

为 了 解释 这 种 思想 , 考虑 生产 电动 机 轴 的 制造 过 程 . 质量 控制 检查 员 可 能 会 每 10 min 选择 一 根 
fü, 并 测量 其 直径 , 这 些 测量 值 关 于 时 间 所 作 的 图 , 生产 直径 仅 受 随 机 变异 支配 的 电动 机 轴 的 过 程 
能 力 提供 了 一 个 形象 的 证 据 . 例如 , 10 根 轴 的 直径 可 能 如 图 16.3 R, 虽然 这 10 根 轴 的 直径 随时 
间 而 变化 , 但 是 全 都 落 在 制造 商 规定 的 控制 限 集合 中 ,这 个 过 程 表现 为 “ 受 控 ”. 

这 些 控制 限 是 怎样 建立 的 呢 ? 一 种 广泛 使 用 (并 且 成 功 ) 的 技术 是 在 一 段 时 间 内 监测 已 知 受 
BRIE, 并 计算 样本 质量 测量 值 的 均值 和 标准 差 , 然后 , 对 未 来 的 测量 值 , 应 用 发 现 异常 值 的 z 
得 分 规则 (2. 6 节 ). 我 们 知道 样本 测量 值 落 在 离 均 值 3 倍 标准 差 之 外 是 几乎 不 可 能 的 . 因此 , 如 果 
质量 测量 值 落 在 -3s 之 下 或 者 x+3s 之 上 ,我们 就 说 过 程 “ 失 控 ” ， 对 生产 过 程 的 修正 可 能 是 必 
须 的 . 

为 国防 部 制造 野战 炮 的 公司 运行 一 条 生产 撞 针 的 生产 线 . 为 了 监测 生产 过 程 , 检查 员 每 
隔 30 min 从 生产 线 上 随机 抽取 一 个 撞 针 , 并 测量 其 长 度 (in) , 以 这 种 方式 得 到 的 20 个 撞 针 长 度 样本 
如 表 16. 1 所 示 . 构造 一 个 撞 针 长 度 控制 图 , 这 个 过 程 失控 吗 ? 


表 16.1 例 16.1 中 的 撞 针 长 度 














撞 针 长 度 tt KE 
150L_ — À po 1 1.00 11 1.01 
2 0.99 12 0.99 
= . ° 3 0.98 13 0.98 
= ° 
dá 1.500 ° 4 1.01 14 0.99 
dej 
. 5 1.01 15 0.87 
6 0.99 16 1.01 
1499 —L L L L 1 1 L 1 | L TR 
2 3 4 5 6 7 8 9 10 7 1.06 17 0.99 
时 间 单位 8 0.99 I8 0.99 
图 16.3 10 根 电动 机 轴 的 直径 图 9 0.99 19 0.97 
10 1.03 20 0.99 
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解 ”构造 控制 图 的 第 一 步 是 计算 撞 针 长 度 的 样本 均值 和 标准 差 ， 利用 计算 机 得 到 的 这 些 值 , 如 
图 16. 4 的 SAS 输出 所 示 . 可 以 看 到 样本 均值 是 # =0. 992, 样本 标准 差 是 * =0. 035. 





The MEANS Procedure 

hnalysis Variable : LENGTH 
N Mean Std Dev Minimum Max imum 
20 0.9920000 0.0348833 0.8700000 1.0600000 











图 16.4 撞 针 长 度 的 SAS 描述 性 统计 量 


下 一 步 按 照 时 间 的 先后 顺序 描 出 20 个 样本 测量 值 , 如 图 16. 5 所 示 的 MINITAB 输出 . 特别 地 ， 
在 控制 图 中 有 三 条 水 平 线 . 对 于 计量 控制 图 , 中 心 线 是 样本 均值 元， 中 心 线 估 计 了 过 程 的 均值 . 对 于 
这 个 例子 , 估计 的 撞 针 平均 长 度 是 0. 992 in. 


I Chart of LENGTH 

















1.104 UCL=1.097 
1054 
: | 
3 
加 
> 1.004 e_ _ 
E ` Z NGA we. X-0.992 
z V^ 
E: 
E 035] 
0.904 
LCL-0.887 
i. I 








—T. T- T —T T T 一 T- 
2 4 6 8 10 12 14 16 18 20 
Observation 


图 16.5 撞 针 长 度 的 MINITAB 计量 控制 图 


图 16.5 中 位 于 中 心 线 上 下 的 两 条 线 分 别 为 控制 上 限 (UCL) 和 控制 下 限 (LCL) ， 如 果 过 程 
是 受 控 的 ,那么 期 望 测量 值 落 和 人 这 两 条 线 之 间 , 对 于 计量 控制 图 ;LCL = ç - 3s, UCL z +3s. 
因此 ,有 

LCL =0. 992 -3(0.035) =0. 887 和 UCL =0. 992 43(0.035) =1.097 

注意 15 号 挤 针 的 长 度 测量 值 落 在 了 LCL 以 下 ,所 以 这 个 过 程 是 “失控 ” 的 , 这 说 明生 产 线 可 能 
存在 问题 . 在 这 种 情况 下 ， 过 程 工程 师 通常 应 确定 出 现 这 个 不 寻常 小 (或 大 ) 的 测量 值 的 原因 . 

定义 16. 4 计量 控制 图 的 中 心 线 是 样本 测量 值 的 均值 元 

定义 16. 5 计量 控制 图 的 控制 下 限 (LCL) 和 控制 上 限 (UCL) 由 下 式 计 算得 到 ; 

LCL=z-3s UCL=š+3s 
其 中 s 是 样本 测量 值 的 标准 差 . 
最 后 总 结 关于 单个 计量 控制 图 的 讨论 (或 者 像 通 常 所 说 的 那样 ， 叫做 个 体 值 控制 图 ) ,注意 到 
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图 描述 的 是 过 程 本 身 ， 而 不 是 我 们 希望 它 应 有 的 方式 , 这 一 点 是 重要 的 . 过 程 均值 和 控制 限 可 能 
会 与 产品 制造 商 规定 的 规格 显著 不 同 . 例如 ,虽然 制造 商 想 要 生产 直径 为 1.5 in 电动 机 轴 , 但 是 
实际 的 过 程 均 值 经 常 和 1.5 相差 某 一 个 小 的 量 . 另外 , 由 控制 图 得 到 的 控制 限 也 仅仅 对 分 析 过 去 
的 数据 ,， 即 用 于 计算 中 数据 是 合适 的 , 所 以 , 在 把 它们 应 用 于 未 来 的 生产 数据 之 前 需要 进行 修正 . 
例如 , 在 过 程 发 现 处 于 失控 情形 ( 例 16. 1) ， 只 利用 落 入 原 控 制 限 之 内 的 样本 测量 值 重新 计算 来 
修正 控制 限 和 中 心 线 . 如 果 问 题 的 原因 被 纠正 , 那么 这 些 新 值 就 可 以 作为 未 来 数据 的 控制 限 . 

警告 ”由 控制 图 得 到 的 控制 限 仅仅 对 分 析 过 去 的 数据 ,， 即 在 计算 中 使 用 的 数据 是 合适 的 . 只 
当 过 程 受 控 和 /或 控制 限 被 修正 时 ,它们 才 可 以 用 于 未 来 的 数据 . 

Ap, 为 单个 质量 变量 (如 撞 针 长 度 ) 提 供 了 控制 图 . 也 可 以 为 过 程 均值 、 过程 变 异性 、 百 分 率 缺 
陷 数 和 每 个 个 体 缺 陷 数 构造 控制 图 , 我 们 将 会 在 以 下 各 节 提 出 这 些 类 型 的 控制 图 . 























应 用 练习 区 间 EEEH) Eig) ” 碳 变 化 (%) 
16. 1 软件 文件 更 新 . 参考 练习 5.34, Sofiware Quali- ! 3.25 18 3.55 
ty Professional (2004. 年 11 月 ) 对 软件 工程 师 团 队 2 3.30 19 3.48 
在 摩托 罗拉 公司 工作 的 评估 . 回忆 感 兴趣 的 变量 3 3.23 20 3.42 
是 由 于 有 问题 的 报告 而 要 改变 文件 的 更 新 次 数 ， 4 3.00 21 3.40 
连续 12 个 月 记录 由 某 团队 报告 的 月 更 新 次 数 ， ; is » S so 
数据 附 在 下 表 . 6 3.60 23 3.45 
H 更 新 次 数 月 更 新 次 数 7 3.65 24 3.75 
1 323 7 249 8 3.50 25 3. 52 
9 3.40 26 3.10 
2 268 8 181 
10 3.35 27 3.25 
3 290 9 92 
11 3.48 28 3. 78 
4 405 10 80 
12 3.50 29 3. 70 
5 383 H 30 13 3.25 30 3.50 
6 368 12 7 14 3. 60 31 3.40 
资料 来 源 , Holmes, J. S. "Software measurement using SCM . " 15 3.55 32 3.45 
Sofiware Quality Professional, Vol. 7, No. 1, Nov. 2004([&] 5). 16 3.60 33 3.30 
a. 确定 数据 的 计量 控制 图 中 心 线 的 位 置 . 17 2.90 
b， 确 定 控制 上 下 限 的 位 置 . 资料 来 源 ; Hoffman, G. and Tsuge, O. “TTmk3—Applica- 
c 过程 受 控 吗 ? tion of a new ironmaking technology for the iron ore mining in- 
16.2 新 炼 铁 过 程 . 参考 练习 10.21, Mining Engi- dustry. ” Mining Engineering, Vol. 56, No. 9, October, 2004 


neering (2004 年 10 月 ) 研究 的 一 种 直接 由 原始 铁 (图 5). 
矿石 和 煤 生产 高 质量 铁 块 的 新 技术 . 对 于 研究 的 一 、 

16.3 Wg. 一 ZR] B. + 
区 间 的 数据 列 于 表 中 . 为 数据 构造 并 解释 计量 控制 瓶子 的 重量 ( 盎司 ) 上 个 月 的 检查 数据 如 下 才 
图 ,这 个 过 程 受 控 吗 ? FR. l mi 
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天 重量 天 重量 (E) 

I 5.6 11 6.2 

2 5.7 12 5.9 

3 6.1 13 5.2 

4 6.3 14 6.0 

5 5.2 15 6.3 

6 6.0 16 5.8 

7 5.8 17 6.1 

8 5.8 18 6.2 a. 确定 计量 控制 图 中 心 线 的 位 置 . 

» » 7 b， 确 定 控制 上 下 限 的 位 置 
— —— l 一 OS Ll c. 过 程 受 控 吗 ? 
a. 为 制 成 的 瓶子 重量 构造 一 个 计量 控制 图 . 16.5 可 变 电 阻 器 的 旋钮 插入 . 由 塑料 铸模 生产 的 
b. 这 个 月 的 过 程 受 控 吗 ? 可 变 电 阻 器 旋钮 包括 一 个 金属 柑 人 物 , xc ee 


16.4 橡胶 模 制 伸缩 接头 . 用 于 加 热 和 空调 系统 的 橡 插入 装配 零件 的 合适 性 由 旋钮 后 部 到 远离 针 油 
胶 模 制 伸缩 接头 的 设计 内 径 为 5 in. 为 了 监视 制造 那 一 边 的 距离 来 决定 . 为 了 监视 铸模 运行 ， 从 每 
EUER, YE 12 h 之 内 , 每 隔 一 小 时 从 生产 线 挑选 一 个 小 时 产品 中 随机 选取 一 个 旋钮 , 然后 测量 其 尺寸 ， 
接头 并 测量 直径 (in) , 如 下 表 所 示 . 利用 这 些 数 据 下 表 给 出 了 过 程 运 行 的 前 27 个 小 时 的 测量 距离 . 





构造 计量 控制 图 . a 为 过 程 构造 计量 控制 图 . 
b. 在 图 中 确定 中 心 线 、 控 制 上 限 和 控制 下 限 的 
位 置 . 


e. 这 个 过 程 受 控 吗 ? 











小 时 距离 小 时 距离 小 时 ES [o 小 时 距离 
1 0. 140 8 0. 143 15 0.144 22 0.139 
2 0.138 9 0.141 16 0.140 23 0.140 
3 0.139 10 0.142 17 0.137 24 0.134 
4 0.143 11 0.137 18 0.137 25 0.138 
5 0.142 12 0.137 19 0.142 26 0.140 
6 0.136 13 0.142 20 0.136 27 0.145 
7 




















16.3 ”均值 控制 图 : x 


用 于 监测 定量 质量 特征 而 构造 的 控制 图 通常 基于 几 个 单位 产品 的 随机 样本 ， 而 不 是 基于 图 
16. 3 所 示 的 个 别 工业 单位 的 特征 . 例如 ,16. 2 节 中 电 轴 的 制造 商 可 能 会 在 每 个 小 时 的 最 后 挑选 5 
个 轴 的 样本 ,描述 样本 平均 直径 ， 即 相 应 于 每 个 时 间 点 的 均值 图 称 为 均值 控制 图 或 者 图. 

实际 上 , 修正 可 查 明 原因 的 变异 而 调整 过 程 ， 且 认 为 过 程 是 受 控 之 后 , 才 构造 控制 图 . 当 过 程 受 
控 时 , x 图 仅 描述 样本 均值 关于 时 间 的 随机 变异 性 . 理论 上 ,x 围绕 过 程 均 值 E(x) =u 变化 , 并 且 以 





O 为 了 和 质量 控制 文献 中 的 符号 一 致 ， 我们 使 用 x( 而 不 是 7) 来 表示 定量 的 质量 特征 变量 . 
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一 个 很 大 的 概率 落 在 界限 1 +30 或 .+30/Wn 内 . 对 每 小 时 取 n=5 根 电动 机 轴 的 样本 均值 , 构造 的 
控制 图 可 能 如 图 16.6 所 示 . 

如 图 16.6 所 示 , # 图 包含 三 条 水 平 线 . 中 心 线 是 过 程 的 均值 人 ,虽然 这 个 值 通常 是 未 知 的 , 但 是 
当 过 程 受 控 时 ， 可 以 用 大 量 (如 20) 样 本 均值 的 平均 值 来 估计 . 例如 ,如 果 求 个 样本 均值 的 平均 值 ， 
那么 


»E 
d 

位 于 中 心 线 上 、 下 的 两 条 线 分 别称 为 控制 上 限 ( ULC) 和 控制 下 限 (LCL) , 如 果 过 程 受 控 , 那么 
可 以 期 望 样本 均值 落 在 这 两 条 线 之 间 , 这 两 条 线 上 距离 中 心 线 上 下 30; 23o//nith. 

过 程 的 标准 差 r 通常 是 未 知 的 , 但 是 当 过 程 受 控 时 , 它 可 以 由 收集 的 大 样本 数据 估计 . 在 出 现 
计算 机 之 前 , 一 般 首先 计算 样本 极 差 R, 最 大 和 最 小 样本 测量 值 之 间 的 差 来 估计 o. 然后 由 上 个 样本 
极 差 的 平均 R 除 以 常数 d, 来 估计 过 程 的 标准 差 or: 





中 心 线 = x = 





























k 
a R > R;/k i UCL 
77d, d El ° 
2 2 Ë e ° 307 
d, 的 值 依赖 于 样本 容量 n, 因为 控制 限 距离 中 心 E, ° ° 中 心 线 
REF 30; -3o//n Mb, 这 个 距离 的 估计 为 ga . ° au 
~ 3(R/d,) 3 — _— f I MM Lao. 
3 os =— —— =— RR-A, R 
77 C dem [23 4 144 4-8 
时 间 (h) 
其 中 A, 23/(d, Vn). 对 样本 容量 n=2 到 n=25 . 
M A, 和 d, 的 值 在 表 B. 19 中 给 出 . E166 n=5 根 轴 直 径 样本 的 4 图 
x 图 的 中 心 线 和 控制 限 的 位 置 
k 
Ys 
中 心 线 : = ^E 
UCL: x +A, R 
LCL: x -A, R 
其 中 ,k= 每 个 样本 量 为 n FEAR, 2, = 第 i 个 样本 的 样本 均值 , R= 第 i 个 样本 的 极 差 . 
_ ÈR 
R= 有 
A, 由 表 B. 19 给 出 . 
(Ri 对 于 从 没有 时 间 趋 势 寺 程 中 收集 的 大 样本 ( 如 n>15)， 控制 上 限 和 控制 下 限 可 以 如 下 计算 : 
UCL: x +3s/Yn LCL; x -3s//n 
其 中 s 是 所 有 nk 个 样本 测量 值 的 标准 差 . 
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如 今 , 质量 控制 过 程 的 样本 测量 值 可 以 输入 到 计算 机 , 通过 计算 机 编程 来 计算 单个 样本 的 均值 
和 标准 差 ,也 可 以 计算 包含 任意 % 个 样本 集合 数据 的 均值 和 标准 差 . 当 不 存在 时 间 趋 势 ( 见 16.5 节 ) 
且 样 本 很 大 时 , = 的 最 好 估计 是 包含 在 上 个 数据 集中 数据 的 标准 差 sO. 计算 机 计算 和 s 并且 输 出 
控制 图 . 然而 , 计算 样本 极 差 的 简便 性 不 能 被 忽略 . 通过 报告 样本 极 差 而 不 是 * 可 以 节省 时 间 、 精 力 
和 人 金钱, 所以, 在 实践 中 , 基于 R 的 图 仍 是 标准 的 方法 . 
假定 制造 电 轴 的 过 程 受 控 , 在 20 h 期 间 制 造 商 在 每 小 时 结束 时 挑选 4 个 轴 的 随机 样本 ， 
并 且 测 量 每 个 电 轴 的 直径 , 20 个 样本 的 测量 值 (in) 记 录 在 表 16.2 中 . 对 样本 均值 构造 控制 图 并 解释 
结果 . 

解 ”构造 4 图 的 第 一 步 是 计算 20 个 样本 中 每 一 个 的 样本 均值 二 和 极 差 R, 这 些 值 在 表 16. 2 中 
的 最 后 两 列 给 出 . 

EK, 我 们 利用 SAS 来 计算 20 个 样本 均值 的 平均 值 ,20 个 样本 极 差 的 平均 值 R, 如 图 16.7 的 
输出 所 示 , 这 些 值 分 别 为 X=1.500425, R =0. 01985. 

表 16.2 例 16.2 中 n=4 根 轴 直 径 的 样本 





样本 号 样本 测量 值 (in) 样本 均值 # RÉ R 
1 1. 505 1. 499 1. 501 1. 488 1. 4983 0. 017 
2 1. 496 1. 513 1.512 1. 501 1. 5055 0.017 
3 1. 516 1. 485 1.492 1. 503 1. 4990 0. 031 
4 1. 507 1. 492 1.511 1. 491 1. 5003 0. 020 
3 1.502 1.491 1. 501 1. 502 1. 4990 0. 011 
6 1.502 1.488 1. 506 1. 483 1. 4948 0. 023 
7 1.489 1.512 1.496 1. 501 1. 4995 0. 023 
8 1.485 1.518 1. 494 1. 513 1. 5025 0. 033 
9 1. 503 1. 495 1. 503 1. 496 1. 4993 0. 008 

10 1. 485 1. 519 1. 503 1. 507 1. 5035 0. 034 
11 1.491 1. 516 1. 497 1. 493 1. 4993 0. 025 
12 1. 486 1. 505 1.487 1. 492 1. 4925 0. 019 
13 1. 510 1. 502 1. 515 1. 499 1. 5065 0. 016 
14 1.495 1. 485 1. 493 1. 503 1. 4940 0. 018 
15 1. 504 1. 499 1. 504 1. 500 1. 5018 0. 005 
16 1. 499 1. 503 1. 508 1. 497 1. 5018 0.011 
17 1.501 1. 493 1. 509 1. 491 1. 4985 0.018 
18 1. 497 1. 510 1. 496 1. 500 1. 5008 0.014 
19 1. 503 1. 526 1. 497 1. 500 1. 5065 0. 029 
20 1. 494 1. 501 1. 508 1. 519 1. 5055 0. 025 





O Grant and Leavenworth( 1988) 建 议 当 样 本 容量 n KF 15 时 , H s 来 估计 o. 对 小 样本 , RZd, 通常 提供 一 个 较 好 的 估计 . 
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The MEANS Procedure 








Variable N Mean Std Dev Minimum Max i mum 
XBAR 20 1.5004250 0.0039413 1.4325000 1.5065000 
RñNGE 20 0.0138500 0.00809334 0.0050000 0.0340000 








图 16.7 轴 直 径 的 和 极 差 的 SAS 描述 性 统计 量 


fH z = 1. 500425 作为 控制 图 的 中 心 线 . 为 了 求 控制 上 下 限 , 需要 知道 控制 限 因子 A; 的 值 , 它 可 
以 在 表 B. 19 中 找到 . 对 于 每 个 样本 中 n=4 个 测量 值 ， 4， =0. 729. 那么 
UCL =+ + A, R=1.500425 + (0. 729) (0. 01985) =1. 51489 


LCL =% - A, R 21. 500425 - (0. 72€) (0. 01985) =1. 48596 


利用 这 些 限 , 构造 样本 均值 控制 图 如 图 16. 7 的 MINITAB 输出 所 示 . 注意 所 有 的 20 个 样本 均值 
都 落 在 控制 限 之 间 . 

x 图 的 目的 在 于 发 现 与 过 程控 制 的 偏离 . 如 果 过 程 受 控 ， 那么 样本 均值 落 在 控制 限 之 间 的 概率 
是 非常 大 的 , 这 是 因为 对 于 大 样本 , 中 心 极限 定理 保证 了 25; 的 抽样 分 布 近似 为 正 态 分 布 . 所 以 , z 落 
在 控制 限 之 间 即 +3 G6; 之 内 的 概率 大 约 是 0.997. 因此 ， 一 个 样本 均值 落 在 控制 限 之 外 作为 生产 过 程 
可 能 存在 问题 的 一 个 指标 . 当 这 种 情况 发 生 时 ， 我 们 以 一 个 很 高 的 置信 度 说 过 程 失控 , 常 需要 指派 
过 程 工程 师 确定 出 现 不 寻常 大 (或 者 小 的 )z 值 的 原因 . 

丸 一 方面 , 当 所 有 样本 均值 都 落 在 控制 限 内 时 (如 图 16. 8 所 示 ) , 我 们 说 过 程 受 控 . 然而 在 这 个 
陈述 中 没有 如 上 述 “ 失 控 ” 断 言 那 样 相同 的 置信 程度 . 在 某 种 意义 上 , 利用 控制 图 检验 原 假设 Ho: 过 
程 受 控 ( 即 不 存在 可 查 明 原 因 的 变异 ) , 正如 第 9 章 所 述 ， 因为 第 二 类 错误 的 概率 是 未 知 的 , 所 以 在 
不 拒绝 Ho 时 必须 非常 小 心 . 在 实践 中 ， 当 质 量 控制 工程 师 说 “过 程 受 控 " 时 ,他 们 的 真正 意思 是 “ 按 
照 好像 不 存在 可 查 明 原因 的 变异 那样 行动 是 合算 的 ”. 在 这 种 情况 下 , 最 好 是 不 管 过 程 , 而 不 是 花费 
许多 时 间 和 金钱 去 寻找 可 能 不 存在 的 问题 . 
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图 16.8 例 16.2 轴 直径 的 MINITAB x 图 
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在 结束 图 的 讨论 之 前 , 必须 指出 重要 的 两 点 . 第 一 , 在 实践 中 , x 图 和 监测 过 程 变异 的 控制 
E, 即 尽 图 常 一 起 使 用 . 事实 上 , 因为 样本 极 差 (或 标准 差 ) 用 于 构造 图 , 所 以 检查 民 图 , 首先 保证 
过 程 变 异 是 稳定 的 , 这 是 必要 的 . R 图 是 下 一 节 的 主题 . 





SERE x El 
过 程 “失控 ”: 一 个 或 多 个 样本 均值 落 在 控制 限 外 9 这 说 明生 产 过 程 可 能 存在 问题 , 应 该 设法 确定 出 现 
无 不 寻常 大 (或 小 ) 值 的 原因 . 
过 程 “ 受 控 ”: 所 有 样本 均值 都 落 在 控制 限 内 ， 虽然 可 能 存在 可 查 明 原因 的 变异 ， 但 是 不 理会 过 程 比 寻 
找 可 能 不 存在 的 问题 好 . 











对 于 图 以 及 一 般 的 控制 图 ,要 说 明 的 第 二 点 是 抽样 计划 的 重要 性 . 理想 地 , 希望 随时 间 选 择 个 
体 的 样本 ,使得 我 们 可 以 最 大 化 发 现 过 程 变 化 的 机 会 , 如 果 存 在 的 话 . 为 此 ,选择 个 体 的 合理 子 组 
(样本 ) 使 得 过 程 均 值 的 改变 ( 如 果 它 存在 ) 发 生 在 样本 之 间 ， 而 不 是 在 样本 之 内 ( 即 不 在 抽取 样本 期 
间 内 ). 下 面 的 例子 说 明了 这 一 点 . 

定义 16. 6 合理 子 组 是 收集 的 个 体 样本 ， 使 得 下 面 两 个 机 会 最 大 ; (1 ) 每 个 样本 内 的 质量 测量 
值 是 相似 的 (2) 样 本 间 的 质量 测量 值 是 不 同 的 . 
EXE 参考 例 16.2 关于 制造 电动 机 轴 过 程 的 讨论 . 假定 生产 管理 人 员 怀疑 夜班 工人 生产 轴 的 平均 
直径 大 于 早 班 和 中 班 工人 生产 的 ,管理 人 员 想 用 图 确定 过 程 均值 是 否 发 生变 化 ,为 这 位 管理 人 员 提 
出 一 个 遵从 合理 子 组 策略 的 抽样 计划 ， 即 应 该 怎样 挑选 4 个 轴 的 样本 , 使 得 发 现 均值 变化 的 会 最 大 . 

t 显然 ， 应 该 用 每 个 班 内 抽出 的 轴 样 本 来 构造 控制 图 . 例如 , 管理 人 员 可 以 在 连续 的 24 个 小 
时 内 每 小 时 抽样 4 A 

那么 前 8 个 样本 来 自 早 班 , 后 8 个 来 自 中 班 , 最 后 8 个 来 自 晚 班 . 这 样 ， 所 有 样本 都 不 会 跨 班 
‘这 不 同 于 比如 两 个 轴 来 自 中 班 , 两 个 轴 来 自 晚 班 的 样本 . ) 这 些 24 个 样本 表示 轴 的 合理 子 组 ,是 为 
了 发 现 轴 直 径 均值 变化 可 归 因 于 夜班 工人 的 机 会 极 大 化 而 设计 的 . 


应 用 练习 芯片 , 并 且 测 量 电路 的 宽度 . 这 些 数据 及 构造 的 元 


16.6 计算 机 的 CPU 芯片 : 微型 计算 机 的 中 央 处 理 图 的 MINITAB 输出 如 下 页 所 示 . 
器 (CPU) 是 包括 上 百 万 个 品 体 管 的 计算 机 芯片 , p" TUER-O US, 计算 控制 图 的 控制 上 下 限 ， 上 


FABAS, 以 及 上 下 B-C 89. 
接 晶体 管 的 是 仅 0.5 ~ 0. 85 pm 粗 的 细 长 的 电路 . a f 、 
为 了 理解 这 些 有 多 么 细 , 想 Lum 就 是 1 m 的 b. 对 于 CPU 芯片 上 电路 过 程 的 稳定 性 , 控制 图 说 


; 、 明了 什么 ? 证 明 你 的 回答 . 
一 ， 一 33 70 um TH ( Computer , 
992). eme USD kumu B U 5- 控制 限 应 该 用 于 监测 未 来 的 过 程 输出 吗 ?请 解释 
; 4 16.7 4&4 A4 KE. 一 家 为 国防 部 制造 野战 炮 的 公司 
0.85 pm 粗 , 那么 在 芯片 运行 中 将 会 出 现 各 种 各 样 、 " 
的 问题. 制造 商 在 连续 的 5 天 内 每 天 6 次 (从 早上 运行 一 条 生产 精巧 撞 针 的 生产 线 . 为 了 监测 过 程 ， 
8:00 到 下 午 4: 30 9/8 90 min 一 次 ) 抽样 4 个 Cpu ”检查 员 在 5 个 小 时 中 每 30 min 从 生产 线 上 随机 挑 





© 除了 “一 个 或 更 多 的 点 藩 在 控制 限 外 "这 条 规则 以 外 ， 还 有 几 条 其 他 “模式 分 析 "规则 来 帮助 分 析 师 确定 过 程 是 否 失 
控 . 例如 , NUR 5 个 相继 点 中 的 4 个 在 +2o xau -25 * 之 外 , 这 个 过 程 也 是 失控 的 ， 对 于 这 些 经 验 规则 的 详细 讨论 
参见 参考 文献 . 


O 上 下 控制 限 为 +3 G; , EF A-B 界 为 # 25>， 上 下 B-C AUR $a G,. — 译 者 注 . 
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练习 16. 6 中 的 MINITAB 输出 
选 5 个 撞 针 并 测量 其 长 度 (in). a. 确定 x 图 的 中 心 线 位 置 . 


a 利用 表 中 10 个 时 间 段 的 数据 计算 大 图 的 中 


心 线 . 


b， 计 算 控 制 上 下 限 . 


c. 计算 用 来 形成 撞 针 长 度 z 图 的 10 个 样本 均值 ， 





并 作 图 . 
d. 假定 国防 部 规定 撞 针 长 度 为 1. 00 in +0. 08 in, 那 
么 制造 过 程 受 控 吗 ? 
30 min 间隔 撞 针 长 度 

1 1.05 1.03 0.99 1.00 1.03 
2 0.93 0. 96 1.01 0.98 0.97 
3 1.02 0. 99 0. 99 1. 00 0. 98 
4 0. 98 1.01 1.02 0. 99 0.97 
5 1.02 0. 99 1.04 1.07 0. 98 
6: 1.05 0.98 0.96 0.91 1.02 
7 0.92 0.95 1. 00 0.99 1.01 
8 1.06 0.98 0.98 1.04 1.00 
9 0.97 0. 99 0. 99 0. 98 1.01 
10 1.00 0.96 102 1.03 099 


—————— tl 99 f 
16.8 模 制 橡 胺 伸缩 接头 . 参考 练习 16.4, 用 于 加 热 
和 空调 系统 的 模 制 橡胶 伸缩 接头 的 生产 . 为 了 监测 
制造 过 程 的 均值 , 在 12 h 中 每 小 时 从 生产 线 上 随机 
选取 8 个 接头 (而 不 是 一 个 接头 ) 测 量 它们 的 直径 
(in), 如 下 表 所 示 , 12 个 样本 的 数据 将 用 于 构造 


x 图 . 


b， 确 定 控制 上 下 限 的 位 置 . 
e. 计算 并 画 出 12 个 样本 均值 , 产生 接头 直径 的 
图 . 这 个 过 程 受 控 吗 ? 
小 时 模 制 橡胶 伸缩 接头 的 直径 
5.08 5.01 4.99 4.93 4.98 5.00 5.04 4.97 





2 4.88 5.10 4.93 5.02 5.06 4.99 4.92 4. 91 
3 4.99 5.00 5.00 5.01 5.03 4.92 4.97 s. 01 
4 5.04 4.96 5.01 5.00 5.00 4.98 4.91 4. 96 
5 $00 493 4.94 5.02 5.01 4.97 5.08 5. 11 
6 483 4.92 496 491 5.01 5.03 4.93 5 00 
7 5.02 5.00 4.96 4.98 5.00 5.07 4.94 s. 01 
8 491 5.00 4.97 5.03 5.02 4.99 4.98 4. 99 
9 506 5.04 4.99 5.02 4.97 5.00 5.01 5.01 
10 4.92 4.98 5.01 5.01 4.97 5.00 5.02 4. 93 
ll 5.00 5.00 5.02 4.98 4.99 5.00 5.01 5.01 
12 492 5.12 5.06 4.93 4.98 5.02 5. 04 4.97 


16.9 机 器 人 夹 钳 的 空隙 宽度 . 滑铁卢 大 学 (加 拿 大 ) 
的 统计 学 家 斯 泰 纳 (S，H. Steiner) 把 控制 图 方法 应 
用 到 称 为 机 器 人 夹 钳 的 马蹄 形 金属 扣 件 的 制造 中 
(Applied Statistics, Vol. 47, 1998). 夹 钳 使 用 者 关心 
的 是 两 个 扣 件 尾部 的 空隙 宽 度 , 他 们 建议 的 目标 宽 
度 是 0. 054 in, 一 个 光学 测量 装置 用 于 测量 制造 过 程 
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中 扣 件 的 空隙 宽度 . 制造 商 在 一 天 16 h 的 生产 日 程 
中 每 隔 15 min 抽样 5 个 制 成 的 夹 钳 , 然后 用 光学 装 
置 测量 空隙 宽度 , MESE A 的 生产 数据 列 于 表 中 . 

时 间 空隙 宽度 ( 千 分 之 一 英寸 ) 

00:15 — 542 541 539 540 53.8 





00:30 53.9 53.7 54.1 54.4 55.1 
00: 45 54.0 55.2 53.1 55.9 54.5 
01:00 52.1 53.4 52.9 53.0 52.7 
01:15 53.0 51.9 52.6 53.4 51.7 
01:30 54.2 55.0 54.0 53.8 53.6 
01:45 55.2 56.6 53.1 52.9 54.0 
02:00 53.3 57.2 54.5 51.6 54.3 
02:15 54.9 56.3 55.2 56.1 54.0 
02:30 55.7 53.1 52.9 56.3 55.4 
02:45 55.2 51.0 56.3 55.6 54.2 
03: 00 54.2 54.2 55.8 53.8 52.1 
03:15 55.7 57.5 55.4 54.0 53.1 
03:30 53.7 56.9 54.0 55.1 54.2 
03:45 54.1 53.9 54.0 54.6 54.8 
04:00 53.5 56.1 55.1 55.0 54.0 
资料 来 源 : Steiner, Stefan, H. “Grouped Data Exponentially 
Weighted Moving Average Control Charts. " Applied Statistics- Jour- 


nal of the Royal Statistical Society, Vol. 47, part 2, 1998, 
203-216. 


a. 由 这 些 数据 构造 二 图 . 

b 把 模式 分 析 法 则 应 用 到 控制 图 中 , 你 的 分 析 是 
否 建议 夹 钳 制造 过 程 中 出 现 了 特殊 原因 的 变 
F? 6 条 法 则 中 的 哪 一 条 , 使 你 得 到 这 个 结论 ? 

e. 控制 限 能 用 于 监测 将 来 的 过 程 输出 吗 ? 试 解释 . 


16.10 泥浆 包 数 据 . B. Render( 罗 琳 斯 学 院 ) 和 R. 


M. Stair( 佛罗里达 州立 大 学 ) 提 出 了 贝 菲尔德 造 浆 
公司 的 案例 ( Quantitative Analysis of Management, 
1997). 贝 菲尔德 造 浆 公 司 为 湿地 销 探 公司 提供 可 
以 装 下 50 磅 重 泥浆 处 理 剂 包 的 货车 车 朋 , 泥浆 处 
理 剂 用 于 石油 钻探 时 控制 锥 体 的 pH 值 和 其 他 化 
学 特性 , 湿地 钻探 公司 抱怨 贝 菲尔德 造 浆 公 司 近 
期 运送 包 的 重量 大 多 数 不 足 约 590. (使 用 重量 不 
足 的 包 可 能 会 使 钻探 的 化 学 控制 很 差 , 这 将 会 损 
害 到 钻探 效率 , 导致 严重 的 经 济 后 果 , ) 由 于 害怕 
失去 长 期 顾客 , 贝 菲尔德 造 浆 公司 马上 开始 检查 
他 们 的 生产 过 程 , 管理 者 怀疑 问题 的 原因 是 近期 
增加 的 第 三 个 轮班 以 及 所 有 三 个 轮班 都 是 在 遇 到 
了 因 产 品 需求 增加 而 增加 产量 压力 的 事实 . 他 们 
的 质量 控制 员工 开始 随机 抽样 ,每 小 时 抽取 生产 
的 6 个 包 , 并 测量 其 重量 , 最 近 三 天 每 个 样本 的 
平均 重量 和 每 个 样本 中 最 重 的 及 最 轻 的 重量 都 记 
录 在 表 中 . 

a. 为 这 些 数据 构造 x 图 . 

b， 过 程 在 统计 控制 中 吗 ? 

c. 管理 者 对 第 三 个 班 的 怀疑 是 否 正确 ? 请 解释 ? 











时 间 平均 重量 (1b) 最 轻 最 重 时 间 平均 重量 (也 b) 最 轻 最 重 
6:00 上 午 49.6 48.7 50.7 8:00 51.0 48.6 53.2 
7:00 50.2 49.1 51.2 9:00 50.5 49.4 52.4 
8:00 50.6 49.6 51.4 10: 00 49.2 46.1 50.7 
9:00 50.8 50.2 51.8 11:00 49.0 46.3 50.8 
10:00 49.9 49.2 52.3 12( 午 夜 ) 48.4 45.4 50.2 
11:00 50.3 48.6 51.7 1:00 上 午 47.6 44.3 49.7 
12( 中 午 ) 48.6 46.2 50.4 2:00 47.4 44.1 49.6 
1:00 下 午 49.0 46.4 50.0 3:00 48.2 45.2 49.0 
2:00 49.0 46.0 50.6 4:00 48.0 45.5 49.1 
3:00 49.8 48.2 50.8 5:00 48.4 47.1 49.6 
4:00 50.3 49.2 52.7 6:00 48.6 47.4 52.0 
5:00 51.4 50.0 55.3 7:00 50.0 - 49.2 52.2 
6:00 51.6 49.2 54.7 8:00 49.8 49.0 52.4 
7: 00 51.8 50.0 55.6 9:00 50.3 49.4 51.7 
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(E) 

















时 间 平均 重量 (1b) 最 轻 时 间 平均 重量 (1b) 
10:00 50.2 49.6 51.8 8: 00 49.6 48.0 51.8 
11:00 50.0 49.0 52.3 9:00 50.0 48.1 52.7 
12( 中 午 ) 50. 0 48.8 52.4 10: 00 51.0 48.1 55.2 
1:00 下 午 50.1 49.4 53.6 11: 00 50.4 49.5 54.1 
2:00 49.7 48.6 51.0 12( 中午) 50. 0 48.7 50.9 
3:00 48.4 47.2 51.7 1:00 下 午 48.9 47.6 51.2 
4:00 47.2 45.3 50.9 2:00 49.8 48.4 51.0 
5:00 46. 8 44.1 49.0 3:00 49.8 48.8 50.8 
6:00 下 午 46.8 41.0 51.2 4: 00 50.0 49.1 50.6 
7:00 50.0 46.2 51.7 5:00 47.8 45.2 51.2 
8:00 47.4 44.0 48.7 6:00 46.4 44.0 49.7 
9:00 47.0 44.2 48.9 7:00 46.4 44.4 50.0 
10:00 47.2 46.6 50.2 8: 00 47.2 46.6 48.9 
11:00 48.6 47.0 50.0 9:00 48.4 47.2 49.5 
12( 午 夜 ) 49.8 48.2 50.4 10: 00 49.2 48.1 50.7 
1:00 上 午 49.6 48.4 51.7 11:00 48.4 47.0 50.8 
2:00 50.0 49.0 52.2 12( 午 夜 ) 47.2 46.4 49.2 
3:00 50.0 49.2 50.0 1:00 上 午 47.4 46. 8 49.0 
4:00 47.2 46.3 50.5 2:00 48.8 47.2 51.4 
5:00 47.0 44.1 49. 7 3:00 49. 6 49.0 50.6 
6:00 48.4 45.0 49.0 4:00 51.0 50.5 51.5 
7: 00 48.8 44.8 49.7 5:00 50.5 50. 0 51.9 


资料 来 源 ; Kinard, 二， 正如 西 卡 罗 96 菜 纳 州 大 学 在 Render, B. and Stair, Jr. R. 中 记录 ,，Quantitative Analysis for Management. 
6th ed. Upper Saddle River, NJ; Prentice Hall, 1997. 
16.11 可 变 电 阻 器 的 旋钮 插入 . 参考 练习 16.5, 可 a. 构造 过 程 的 x 图 . 

变 电 阻 器 旋钮 的 制造 . 为 了 监测 过 程 的 均值 ， 从 每 b. 在 z 图 上 确定 中 心 线 , 控制 上 限 和 控制 下 限 的 








小 时 的 闫 品 中 随机 抽样 5 个 旋钮 ,并 测量 每 个 从 旋 his. 

钮 后 部 到 针 洞 远 一 边 的 距离 . 过 程 运行 的 前 27 h 的 c， 过 程 受 控 吗 ? 

测量 值 (in) 如 表 所 示 . 

小 时 距离 测量 值 小 时 距离 测量 值 

1 0.140 0143 0.137 0.134 0.135 | 10 0142 0.137 0.145 0.140 0. 132 
2 0.138 — 0.143 — 0.143 0.145 0.146 | 11 — 0.137 0.147 0.12 0.137 0. 135 
3 0.139 — 0.133 — 0.147 - 0.148 0.139 | 12 0.137 0.146 0.142 0.142 0. 140 
4 0.143 — 0.141. — 0.137 0.138 0.140 | 13 0.142 0.142 0.139 0.141 0. 142 
5 0.142 — 0.142 — 0.145 0.135 0.136 | 14 0.137 0.145 0.144 0.137 0. 140 
6 0.136 — 0.144 — 0.143 0.136 0.137 | 15 0.144 0.142 0.143 0.135 0. 145 
7 0.142. — 0.147 — 0.137 0.142 0.138 | 16 0.140 0.132 0.144 0.145 0. 141 
8 0.143 — 0.137 0.145 0.137 0.138 | 17 0.137 0.137 0.12 0.143 0. 141 
9 0.141 0.142 0.147 0.140 0.140 || 18 0.137 0.142 0.12 0.145 0. 143 
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(5) 
小 时 距离 测量 值 小 时 距离 测量 值 
19 0.142 0.142 0. 143 0. 140 0. 135 | 24 0. 134 0. 147 0. 143 0. 141 0. 142 
20 0. 136 0. 142 0. 140 0. 139 0. 137 25 0. 138 0. 145 0. 141 0.137 0. 141 
21 0. 142 0. 144 0. 140 0. 138 0. 143 26 0. 140 0. 145 0. 143 0. 144 0. 138 
22 0. 139 0. 146 0. 143 0. 140 0. 139 27 0. 145 0. 145 0. 137 0. 138 0. 140 
23 0. 140 0. 145 0. 142 0. 139 0. 137 








资料 来 源 : Grant, E. L. , and Leavenworth, R. S. , Statistical Quality Control, 5th ed. New York McGraw-Hill, 1950(3 1 -2). Re- 


printed with permission. 


16.4 过程 变异 控制 图 : B El 


在 质量 控制 中 , 我 们 不 仅 想 要 控制 某 个 质量 特征 的 均值 , 还 想 控制 它 的 变异 性 . 过 程 标准 益 o 
的 增 大 意味 着 质量 特征 变量 将 会 在 一 个 较 宽 的 范围 内 变化 , 因此 增加 了 生产 次 品 的 概率 . 所 以 ， 受 
控 的 过 程 以 一 个 相对 固定 的 过 程 均值 和 标准 差 o 生成 数据 . 

质量 特征 的 变异 利用 极 差 图 或 尺 图 来 监测 . 所 以 , 除了 计算 每 个 样本 均值 3, 还 需要 计算 和 画册 
样本 极 差 R. 正如 图 一 样 , R 图 也 包含 一 条 中 心 线 和 相应 的 控制 上 限 和 控制 下 限 O， 

样本 极 差 的 期 望 值 和 标准 差 是 : 

E(R) = dso H Tr = d,c 
AUT dy FI ds ILR B. 19) 是 依赖 于 样本 容量 n 的 常数 . 因此 ,我 们 确定 下 图 的 中 心 线 位 于 由 r 处 ， 
其 中 如 果 o 是 未 知 的 ,就 用 下 个 样本 极 差 的 均值 R 来 估计 ECR)O. 





图 的 中 心 线 和 控制 限 的 位 置 
中 心 线 : R 
UCL: D, R 
LCL: D, R 
其 中 ,大 = 样本 容量 均 为 于 的 样本 个 数 ,， 尺 = 第 i 个 样本 的 极 差 ， 


k 

















R, 
R — del 


k 
对 于 样本 容量 n=2 到 n=25 的 D, fo D, dc B. 19 给 出 . 

















控制 上 下 限 距离 中 心 线 上 下 3o, =3dso Ab. HR/d 估计 o, 控制 上 下 限 的 位 置 如 下 ， 


_ d- dz\— _ 
UCL: R+3 FR=( 3 JR D,R 
d, d, 





O 我 们 也 可 以 在 S 图 中 画 出 样本 标准 差 来 监测 过 程 的 变异 性 . 然而 , 本 章 我 们 仅 关 注 尽 图 , 因为 (1) 当 样 本 量 小 于 等 于 9 
BÍ, S 图 和 尺 图 所 反映 的 信息 大 致 相同 ,(2) TEIE R AHE S 图 更 广泛 (主要 因为 样本 极 差 比 样本 标准 差 容 易 计 
F). 对 于 5 图 的 更 多 信息 参考 本 章 的 文献 . 

OQ 另外 一 种 方法 , 可 以 利用 包含 在 个 样本 中 的 所 有 数据 的 标准 差 来 估计 o. 
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其 中 : 
ds 
Dis=1+3 d; 
和 
— d- ds \— _ 
LCL:R -3 2R= (1 EPA j=D, R 
d, d, 
其 中 
ds 
D, =1-3 


对 于 样本 容量 为 n=2 到 n=25 已 经 计算 出 D, A D, 的 值 , 如 表 B. 19 所 示 . 
参考 例 16. 2 监测 电动 机 轴 制 造 过 程 的 问题 . 回忆 制造 商 在 20 个 小 时 期 间 每 小 时 选取 4 
根 轴 的 样本 , 并 测量 每 根 轴 的 直径 . 假定 过 程 受 控 ， 构造 并 解释 这 个 过 程 变异 的 R Fg. 
解 ”在 例 16.2 中 , 我 们 计算 了 20 个 样本 极 差 的 均值 为 R =0. 01985 ,这 个 值 就 是 中 心 线 . XF n= 
4, X B. 19 中 给 出 的 D, A D, 的 值 分 别 为 D; =0, D, =2. 282. 那么 RR 图 的 控制 上 下 限 分 别 为 : 
UCL = D, R = (2. 282) (0. 01985) =0. 0453 
LCL = D, R = (0) (0.01985) =0 
16.2 中 20 个 样本 极 差 的 灵图 如 图 16. 9 的 MINITAB 输出 所 示 . 
R Chart of DIAMETER 























0.054 -~ 
UCL=0.04528 
0047 
Š 
Š 0034 
L:] 
£ 
F 
Ë 0024 R=0.01985 
I y 
0.014 
0.004 LCL=0 
2 4 6 B 10 12 14 16 B 20 


Sample 
E 16.9 45] 16. 4 中 轴 直 径 尺 图 的 MINITAB 输出 


为 了 监测 制造 过 程 生产 的 轴 直 径 的 变异 ， 质量 控制 工程 师 检 查 后 确定 样本 极 差 没 有 超过 0. 0453 
in 的 UCL. (因为 LCL 为 0, 没有 直径 可 以 落 在 这 个 值 以 下 . ) 

及 图 的 实际 应 用 与 关联 的 让 图 相似 . 落 在 控制 限 之 外 的 尺 值 受到 怀疑 ， 提示 过 程 可 能 改变 . Fe 
本 极 差 的 趋势 也 可 以 说 明 ,例如 机 器 的 磨损 问题 . (将 在 下 一 节 讨论 这 类 问题 . ) 正 如 二 图 的 情形 ， 
及 图 可 能 提供 一 个 过 程 存在 问题 的 指标 ， 然后 再 由 过 程 工程 师 努 力 找 出 问题 , 如 果 事 实 上 存在 
的 话 . 
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解释 R E 
过 程 “失控 ”: 一 个 或 多 个 样本 极 差 落 在 控制 限 外 . 5 EE, 这 指出 生产 过 程 中 可 能 的 变化 ,并 且 
应 该 尽量 找 出 问题 . 
过 程 “ 受 控 ”: 所 有 样本 极 差 都 落 在 控制 限 内 . 在 这 种 情形 下 ,最 好 是 不 管 过程 ， 而 不 是 寻找 可 能 不 存 
在 的 问题 . 











记 住 , 在 # 图 之 前 构造 并 解释 尺 图 是 重要 的 . 当 R 图 说 明 过 程 变 异 是 受 控 时 ， S k ift sz 图 才 


应 用 练习 用 图 来 监测 挤 针 长 度 的 的 变异 . 
16.12 计算 机 的 CPU $H. 参考 练习 16.6, 所 需 的 a. 确定 RR 图 中 心 线 的 位 置 . 
电路 宽度 为 0. 5 ~0. 85 pm. 制造 商 在 连续 5 天 内 每 。 b. 确定 尺 图 的 控制 上 下 限 位 置 


天 6 次 (从 早上 8:00 到 下 午 4:30 每 隔 90 min — c. 计算 并 在 有 图 中 画 出 10 个 样本 极 差 , 过程 的 变 
次 ) 抽 取 4 个 CPU 芯片 , 然后 测量 电路 的 宽度 . 用 SEREG? 
于 构造 MINITAB R 图 如 下 所 示 . 16.14 Hb HUE Pb ig HL. 为 练习 16. 8 中 的 数据 构 
a 计算 控制 图 的 控制 上 下 限 . È R Bl, 监测 由 制造 过 程 产生 的 模 制 橡胶 伸缩 接 
b. 在 收集 数据 这 段 时 间 内 ， 关 于 出 现 变异 的 特殊 头 直径 的 变异 , 这 个 过 程 受 控 吗 ? 

RA, R 图 提示 了 什么 ? 16.15 XE A X BEER. 参考 练习 16.9 中 机 器 
c. 控制 限 应 该 用 于 监测 将 来 的 过 程 输出 吗 ? 请 人 夹 钳制 造 商 关 心 的 空隙 宽度 . 

解释 . a， 为 空隙 宽度 构造 尺 图 . 
d. 控制 图 上 有 多 少 个 不 同 尺 值 ? 注意 大 多 数 的 RR 值 b. 图 提供 了 制造 过 程 中 哪个 参数 的 信息 ? 

都 落 在 三 条 水 平 线 上 , 是 什么 产生 这 样 的 模式 ? c. 对 于 在 数据 收集 期 间 出 现 变 异 原因 , RR 图 提示 

16.13 44 KE. 参考 练习 16.7. 假定 检查 员 要 了 什么 ? 


R-Chart for Pathwdth 


UCL 





Center = 0.335 


Sample Range 


0.3 


9.0 LCL 


0 5 10 15 20 25 30 
Sample Number 
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16. 16 


泥 桨 包 数 据 . 参考 练习 16. 10, 贝 菲尔德 造 浆 
公司 关心 发 现 他 们 的 装 料 操作 生产 泥浆 包 不 足 量 


的 原因 . 
a. 构造 装 料 过 程 尺 图 . 
b. Ejs R Bl, 过 程 是 统计 受 控 吗 ? 请 解释 . 


c. 灵图 能 提供 所 关心 的 贝 菲尔德 不 足 量 装 料 问题 


的 原因 吗 ? 请 解释 . 


16. 17 


可 变 电 阻 器 的 旋钮 插入 , 为 练习 16. 11 中 的 


数据 构造 尺 图 ， 过 程 变异 受 控 吗 ? 请 解释 . 


16.18 R BJ 9545 JE. Journal of Quality Technology 
(1998 年 7 月 ) 上 发 表 了 一 篇 关于 检查 测量 精度 对 
图 的 影响 的 文章 . 作者 出 示 了 来 自 英国 营养 物 公 


司 的 数据 , 这 家 公司 将 粉 状 饮食 补充 剂 装 人 标签 为 
“500 g” 的 容器 . 每 隔 15 min 从 装 料 过 程 抽 样 5 个 
容器 , 测量 装 人 物 的 重量 . 第 一 个 表 ( FILLWTI1 X 
件 ) 列 出 了 25 个 连续 样本 用 精确 到 0.5 g 的 称 的 测 
EÉ, 后 面 的 第 二 个 表 ( FILLWT2 文件 ) 给 出 精确 
到 2.5 g 称 的 相同 样本 测量 值 . 在 整个 抽取 样本 时 
期 内 , 已 知 装 料 过 程 是 统计 在 控 的 , 均值 是 500 g， 
标准 差 是 1 g. 
a. 为 精确 到 0.5 g 的 数据 构造 六 图 , 这 个 过 程 统计 
受 控 吗 ? 请 解释 . 
b. 已 知 你 对 a 的 回答 , 对 这 些 数据 构造 x 图 合适 
nj? 请 解释 . 





样本 精确 到 0.5 g 的 装 人 物 重量 极 差 | 样本 精确 到 2. 5 g 的 装 和 信物 重量 极 差 
1 500.5 499.5 502.0 50L0 500.5 2.5 1 500.0 500.0 502.5 500.0 500.0 2.5 
2 500.5 499.5 500.0 49.0 5000 1.5 2 500.0 500.0 500.0 500.0 500.0 0.0 
3 498.5 499.0 500.0 499.5 500.0 15 3 500.0 500.0 500.0 500.0 500.0 0.0 
4 500.5 499.5 499.0 499.0 500.5 1.5 4 497.5 500.0 497.5 4971.5 500.0 2.5 
5 500.0 5010 500.5 500.5 500.0 1.0 5 500.0 500.0 500.0 500.0 500.0 0.0 
6 501.0 498.5 500.0 501.5 500.5 3.0 6 502.5 500.0 497.5 500.0 500.0 5.0 
7 499.5 500.0 499.0 50L0 49.5 2.0 7 500.0 500.0 502.5 502.5 500.0 2.5 
8 498.5 498.0 500.0 5005 500.5 2.5 8 497.5 500.0 500.0 497.5 500.0 2.5 
9 498.0 499.0 502.0 501.0 5015 4.0 9 500.0 500.0 497.5 5000 502.5 5.0 

10 499.0 499.5 499.5 500.0 499.5 1.0 10 500.0 500.0 500.0 5000 500.0 0.0 
11 502.5 499.5 4501.0 501.5 50.0 3.0 11 500.0 505.0 502.5 500.0 500.0 5.0 
12 501.5 5015 5000 500.0 501.0 1.5 12 à 500.0 500.0 500.0 5000 500.0 0.0 
13 408.5 499.5 501.0 500.5 498.5 2.5 13 500.0 500.0 49.5 500.0 500.0 2.5 
14 499.5 498.0 4500.0 1499.5 498.5 20 14 500.0 500.0 500.0 5000 500.0 0.0 
15 501.0 500.0 498.0 500.5 500.0 3.0 15 502.5 502.5 502.5 5000 502.5 2.5 
16 502.5 501.5 502.0 500.5 05005 2.0 16 5000 50.0 5000 5000 500.0 0.0 
17 499.5 500.5 500.0 49.5 49.5 1.0 17 497.5 497.5 497.5 497.5 497.5 0.0 
18 49.0 498.5 4980 50.10 498.0 20 18 5000 500.0 500.0 5000 500.0 0.0 
19 490.0 498.0 501.5 501.0 50.0 3.0 19 495.0 497.5 500.0  Á 5000 500.0 5.0 

20 501.5 499.5 500.0 500.5 5020 2.5 | 20 5000 5025 500.0 5000 502.5 2.5 

21 501.0 500.5 502.0 5025 502.5 2.01] 21 500.0 500.0 500.0 500.0 500.0 0.0 

22 501.5 502.5 502.5 501.5 502.0 1.0| 22 5000 5000 500.0 500.0 500. 0 0.0 

23 499.5 502.0 500.0 5005 502.0 2.5 23 500.0 500.0 500.0 500.0 500.0 0.0 

24 498.5 499.0 à 499.0 500.5 500.0 2.0 | 24 497.5 497.5 5000 497.5 497. 5 2.5 

25 500.0 499.5 498.5 500.0 5005 20 || 25 500.0 500.0 497.5 500.0 500.0 2.5 








资料 来 源 : Tricker, A. , Coates, E. and Okell, E. "The Effects on the R-chart of Precision of Measurement. " Journal of Quality Tech- 


nology, 1998, 7, 30(3) , 232239. 
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c. 为 精确 到 2. 5 g 的 数据 构造 及 图 , 对 于 装 料 d. 基于 你 对 a 和 c 的 回答 , 讨论 在 评估 生产 过 
过 程 的 稳定 性 , 图 提示 了 什么 ? 程 稳定 性 时 测量 仪器 精度 的 重要 性 . 


16.5 发 现 控 制图 中 的 趋势 : 游程 分 析 


正如 前 两 节 所 提 到 的 ,控制 图 也 可 以 检查 % ER 的 值 在 收集 期 间 的 趋势 . 即使 样本 值 落 在 控制 
眼 内 , 这 种 趋势 可 以 提示 存在 一 种 或 多 种 可 查 明 原因 的 变异 . 例如 , 真实 的 过 程 均值 可 能 由 于 机 器 
的 磨损 而 出 现 微小 的 变动 . 

过 程 的 趋势 可 以 由 观测 控制 图 中 心 线 上 下 的 点 的 游程 来 发 现 . 在 质量 控制 中 , 游程 定义 为 所 有 


定义 16. 7 游程 是 落 在 控制 图 中 心 线 同一 侧 的 一 个 或 多 个 相继 点 的 序列 . 

图 16.9 的 尺 图 的 游程 (用 括号 表示 ) 在 图 16. 10 给 出 . 在 中 心 线 上 面 的 样本 极 差 用 “ + "号 表示 ， 
在 中 心 线 之 下 面 的 极 差 用 “ - ”号 表示 . 

注意 , 这 20 个 点 的 序列 由 8 个 游程 组 成 , 起 初 是 两 个 “ - ”游程 ,随后 是 两 个 ^ + 游程， 等 
等 . 研究 人 员 为 基于 游程 理论 的 统计 检验 发 展 做 了 重要 的 工作 ， 这 些 方法 中 有 许多 对 检验 样本 观 
测 值 是 否 随机 地 来 自 于 目标 总 体 是 有 用 的 ， 这 些 检 验 要 求 确定 游程 的 总 数 ( 长 的 和 短 的 同样 对 
fF). 然而 在 质量 控制 中 ， 已 经 发 展 了 几 个 简单 的 规则 ， 仅 基 于 极端 (或 最 长 ) 游程 来 发 现 控 制图 
中 的 趋势. 

为 了 说 明 , 考虑 图 16. 10 的 游程 序列 . 序列 中 的 极端 游程 由 7 +“ — ”号 组 成 . 这 表示 在 12, 13, .…, 
18 小 时 期 间 , 有 7 个 连续 的 样本 极 差 落 在 中 心 线 以 下 . 如 果 事 实 上 不 存在 可 查 明 原因 的 变异 , 那么 有 多 
大 可 能 观测 到 控制 图 上 7 个 连续 的 点 全 都 落 在 中 心 线 的 同一 侧 ? 为 了 回答 这 个 问题 , 我 们 利用 在 第 3 





图 16.10 图 16.9R 图 中 =20 个 样本 极 差 的 游程 


首先 , 注意 到 当 过 程 受 控 时 ， 任何 一 点 落 在 中 心 线 上 侧 ( 或 下 侧 ) 的 概率 都 是 1⁄2. 那么 由 独立 事 
件 概率 的 乘法 定律 ( 兄 第 3 章 ) , 7 个 连续 的 点 落 在 中 心 线 比如 上 侧 的 概率 是 ， 


[z2)(2)(z2)(2)(2)(2)(2)-(2) s 
同样 ,7 个 连续 的 点 落 在 中 心 线 下 人 的 概率 是 { 二】 = -于 因此， 由 概率 的 加 法 定律 ,7 个 连续 的 点 
落 在 中 心 线 同一 侧 的 概率 是 ; 
PO 个 连续 的 点 在 中 心 线 同 _ 侧 ) 


=P(7 个 连续 的 点 在 中 心 线 上 侧 ) + PCT 个 连续 的 点 在 中 心 线 下 侧 ) 

11 2 1 

128 128 128 64 
或 者 是 0.0156. 因为 如 果 过 程 受 控 ， 观测 到 这 种 模式 是 非常 不 可 能 的 (概率 为 0.0156) ,所 以 控制 图 
的 趋势 可 以 作为 生产 过 程 中 可 能 存在 问题 的 -个 信和 号. 
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对 于 控制 图 中 任意 游程 可 以 如 上 面 那 样 计算 概率 , 而 基于 此 值 , 可 以 做 出 是 否 寻找 过 程 中 问题 
的 决定 . Grant and Leavenworth(1988) 推 荐 了 寻找 可 查 明 的 变异 原因 ， 如 果 控 制图 中 出 现任 何 一 种 以 


下 的 点 序列 : 





如 果 控 制图 中 出 现任 何 一 种 以 下 游程 序列 ， 
° 有 7 个 或 更 多 连续 的 点 在 中 心 线 的 同一 侧 . 











发 现 控制 图 中 的 趋势 : 游程 分 析 
就 可 能 存在 可 查 明 原因 的 变异 (如 趋势 ) ; 


° 在 11 个 连续 的 点 中 至 少 有 10 个 点 在 中 心 线 的 同一 仙 . 
。 在 14 个 连续 的 点 中 至 少 有 12 个 点 在 中 心 线 的 同一 侧 . 
° 在 17 个 连续 的 点 中 至 少 有 14 个 点 在 中 心 线 的 同一 侧 . 








上 面 所 述 的 规则 容易 应 用 于 实际 , 因为 只 需要 在 控制 图 中 数 出 连续 点 的 个 数 . 在 每 种 情形 下 ， 
若 过 程 是 受 控 的 , 观测 到 那 种 点 的 序列 概率 近似 为 0.01. (这 个 结论 的 证 明 留 作 练 习 . ) 因 此 , 如 果 这 
些 序列 中 有 一 个 发 生 , 我 们 高 度 相信 生产 过 程 中 存在 某 个 问题 , 可 能 是 过 程 均值 的 移动 . 

有 更 多 的 正式 游程 统计 检验 可 以 使 用 , 如 果 想 要 学 习 这 方面 的 更 多 知识 ， 请 参考 本 章 末 尾 的 


文献 . 


(D 应 用 练习 

16.19 发 现 趋势 . 检查 a ~f 中 点 序列 的 趋势 . 
a ++----- 十 十 十 十 
b -+---++-++++ 
c ----- +++++-- 

d 一 十 十 十 十 十 一 十 十 十 十 十 十 十 十 
e 二 一 十 十 十 一 一 二 十 一 
f —+++++++++- 

16.20 计算 机 的 CPU 芯片 . 参考 练习 16.6 和 练习 
16. 12 中 zz 图 和 尺 图 ,进行 游程 分 析 发 现 过 程 中 的 
任何 趋势 . 

16.21 接 针 的 长 度 . 参考 练习 16.7 和 练习 16. 13 中 


16.6 不 合格 品 百 分 率 控制 图 : p 图 


x EUN R E, 进行 游程 分 析 发 现 过 程 中 的 任何 
趋势 . 

16.22 模 制 橡胶 伸缩 接头 . 参考 练习 16.8 和 练习 
16.14 F z AARE, 进行 游程 分 析 发 现 过 程 中 的 
任何 趋势 . 

16.23 机 器 人 技术 夹 钳 空 陈 宽度 . 参考 练习 16.9 和 
练习 16. 15 H z KARA, 进行 游程 分 析 发 现 过 程 
中 的 任何 趋势 . 

16.24 可 变 电 阻 器 旋钮 插入 . 参考 练习 16. 11 MA 
习 16.17 Pz 图 和 灵图 , 进行 游程 分 析 发 现 过 程 中 
的 任何 趋势 . 


除了 测量 定量 的 质量 特征 以 外 , 我 们 也 对 监测 产品 是 不 合格 品 的 二 项 比率 p 感 兴 趣 . 和 图 情况 一 
PE, 在 某 个 指定 的 时 间 区 间 结束 时 从 生产 线 上 取出 个 个 体 的 随机 样本 . 对 于 每 个 样本 计算 样本 比率 


p=} 


其 中 y 是 样本 中 不 合格 品 的 个 数 ， 然 后 画 样 本 比率 关于 时 间 的 图 ， 并 显示 在 p 图 中 . 
p 图 的 中 心 线 由 包含 在 大 的 个 样本 中 的 数据 综合 确定 ， 过 程 不 合格 品 率 P 的 估计 是 : 


，_ 不 合格 品 总 数 _ 


n: YÀ 





PU K 35 


nk Ek 
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3o; =3 jed 


了 图 的 中 心 线 和 控制 限 的 位 置 





控制 上 下 限 位 于 中 心 线 的 上 下 距离 是 : 








LCL: p -3 tap 


其 中 ,大 = 样本 个 数 ， 每 个 样本 容量 为 m, y; = 第 i AHERCHIOE BERE, Pi o yn 是 第 i 个 样本 的 不 合格 曲率 . 























用 5 来 估计 过 程 的 不 合格 品 率 p, 我 们 求 


UCL -p +3 PUP 


LCL =p -3 PU) 





p 图 的 解释 与 图 和 及 图 的 解释 类 似 , 我 们 期 望 样本 的 不 合格 品 率 落 在 控制 限 内 . 如 果 没 有 做 到 
这 一 点 , 那 就 预示 在 生产 过 程 中 存在 问题 , 应 该 进行 调查 . 
上 记 是 沼 细 ”为 了 监测 用 于 核电 站 上 部 结构 和 基础 热 层 的 橡胶 轴承 支 座 的 制造 过 程 , 质量 控制 工程 师 
在 15 天 内 , 每 天 从 生产 线 上 随机 抽样 100 个 轴承 , 检查 轴承 的 缺陷 , 记录 每 天 发 现 的 不 合格 品 数 如 
表 16. 3 表示 . 构造 轴承 的 不 合格 品 率 p 图 . 


表 16.3 例 16.5 中 15 个 n=100 的 样本 中 有 不 合格 的 轴承 








天 1 2 3 4 5 6 7 8 

不 合格 品 2 12 3 4 4 1 3 5 

不 合格 品 率 0.02 0.12 0.03 0.04 0.04 0.01 0.03 0.05 
X 9 10 11 12 13 14 15 Totals 

不 合格 品 数 3 2 10 3 3 2 3 60 

不 合格 品 率 0.03 0.02 0.10 0.03 0.03 0.02 0.03 0.04 


解 p 图 的 中 心 线 是 在 nk = 1 500 个 轴承 的 组 合 样本 中 不 合格 轴承 的 比率 ; 


，_ 不 合格 的 轴承 总 数 60 
PO RAAS — “1500 





= 0.04 


控制 上 下 限 的 计算 如 下 : 


UCL = p43 J - 0.04 +3 [X90 (0.96).. 0. 04 +0. 0588 = 0. 0988 
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LCL =p - 3, EUP) -0,04 -3 {0-04 0.98) 0, 04 - 0, 0588 = - 0. 0188 
n 


所 以 , 如 果 过 程 是 受 控 的 , 期 望 样本 的 不 合格 橡胶 轴承 比率 以 一 个 很 高 的 概率 落 在 0( 因为 没有 
样本 比率 可 以 是 负 的 ) 和 0. 099 之 间 . 

不 合格 轴承 的 百分率 控制 图 如 图 16. 11 的 MINITAB 输出 所 示 . 注意 , 在 第 2 天 和 第 11 天 , 样本 
比率 落 在 控制 限 之 外 . 这 说 明 在 制造 过 程 中 可 能 存在 问题 , 需要 进一步 的 调查 . 





解释 了 图 
过 程 “ 失 控 ”: 一 个 或 多 个 样本 比率 落 在 控制 限 之 外 . 这 说 明 在 生产 过 程 中 可 能 存在 问题 ， 需 要 进一步 
的 调查 . 
过 程 “ 受 控 ”; 所 有 的 样本 比率 都 落 在 控制 限 之 内 . 此 时 ， 最 好 是 不 管 这 程 , 不 要 寻找 可 能 不 存在 的 问题 . 














一 且 发 现 并 纠正 了 引起 例 16. 5 中 两 个 不 寻常 大 的 不 合格 品 率 问 题 后 , 应 该 修正 控制 限 , 使 其 可 
以 用 于 将 来 的 数据 . 正如 16.2 节 所 提出 的 那样 , 一 种 调整 方法 是 只 基于 落 在 图 16.11 控制 限 之 内 的 
那些 样本 点 , 重新 计算 它们 的 值 , 省 略 第 2 天 和 第 11 天 的 数据 , 便 得 到 修正 值 


P Chart of DEFECTS 


0.124 

1 
0.104 UCL=0.0988 
908] 
004- P=0.04 
0.02 


0.00 l LCL=0 
T —T T T r T TT T T 
6 7 8 9 10 11 12 13 14 15 
Sample 


Fd 16.11 4816.5 中 不 合格 轴承 的 百分率 MINITAB p 图 








Proportion 
e 
° 
e 
1 

















p -不 合格 的 轴承 总 数 (不 包括 第 2 天 和 第 11 天 ) 38 _ 0 029 
P 检查 总 数 (不 包括 第 2 天 和 第 11 天) 1307" 


UCL=p+3 U -p -0.029 +3 /(9. 0292 (2. 971) -0.029 +0. 050 =0. 079 


LCL =p -3 PUP -o, 029 -3 /X9. 929) 00 971) -0.029 -0.050 = —0. 021 


这 样 , 中 心 线 p=0.029, UCL 20.079, LCL - 0 的 控制 图 就 可 用 于 监测 过 程 未 来 所 生产 的 百分数 
不 合格 品 率 . 
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应 用 练习 

16.25 不 合格 的 微米 芯片 . 制造 商 生产 个 人 计算 机 
的 微米 芯片 , 根据 过 去 的 经 验 ， 生产 经 理 认 为 1% 
的 芯片 是 不 合格 的 . 在 一 个 月 之 内 ， 公司 每 隔 一 天 
收集 下 午 4: 00 之 后 制造 的 前 1 000 个 芯片 的 样本 ， 
分 析 世 片 是 否 不 合格 , 这些 数据 和 MINITAB 构造 


的 p 图 在 下 面 给 出 . 

a. 计算 曲线 图 的 控制 上 下 限 . 

b. p 图 对 收集 数据 期 间 关于 特殊 原因 的 存在 有 什 
么 建议 ? 

e. 评论 芯片 制造 商 所 用 的 合理 子 组 策略 . 


P Chart of DEFECTS 











0.0204 
0.0154 
E 
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5 
& 0.010 
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Center = 0.0105 








Sample Number 


— 
12 14 16 


练习 16. 25 的 MINITAB 输出 


16. 26 测试 轮胎 . 固 司 通 橡胶 轮胎 公司 对 监测 由 俄 
交 俄 州 阿 克 伦 工厂 生产 过 程 所 产生 的 花 胎 不 合格 
品 率 感 兴趣 . 公司 的 总 工程 师 认为 这 个 比例 大 约 为 
7%. 因为 在 试验 过 程 中 轮胎 是 要 毁坏 的 , 所 以 公司 
要 使 试验 的 轮胎 数量 保持 最 小 . 总 工程 师 建议 公司 
在 每 天 的 产品 中 随机 抽取 120 个 轮胎 进行 试验 . 至 
JL, 抽取 了 20 个 样本 , 数据 如 表 中 所 示 . 











样本 ”样本 量 CLE 样本 ”样本 量 不 合格 个 数 
1 120 11 11 120 10 
2 120 5 12 120 12 
3 120 4 13 120 8 
4 120 8 14 120 6 
5 120 10 15 120 10 
6 120 13 16 120 5 
7 120 9 17 120 10 
8 120 8 18 120 10 
9 120 10 19 120 3 
10 120 11 20 120 8 


a 构造 轮胎 生产 过 程 的 图 . 
b. 关于 过 程 的 稳定 性 ,曲线 指出 了 什么 ? 请 解释 . 


c. 能 否 用 这 个 控制 限 来 监测 将 来 的 过 程 输出 ? 请 
解释 . 

d. 你 在 b 中 构造 的 p 图 能 否 作 为 p 值 按 每 小 时 变 
化 的 信号 ? 请 解释 . 


16.27 PCCP 中 的 应 力 断 裂 . 预 应 力 钢 简 混凝土 管 


(PCCP) 是 一 种 采用 钢 的 抗 拉 强 度 和 混凝土 的 抗 压 
强度 及 抗 腐蚀 性 的 最 优 条 件 而 设计 的 刚性 管 . 生产 
的 铺设 长 度 为 24 f B PCCP, 在 制造 过 程 中 会 受到 
FERMI RRR. 为 了 监测 这 个 过 程 , ZE Bl 
内 , 每 周 抽取 20 节 PCCP, 每 个 样本 中 的 不 合格 节 
数 ( 即 有 严重 应 力 断 裂 的 节 ) 记录 在 下 表 中 . 


星期 1 2 3 4 5 6 
不 合格 节 数 1 0 2 2 3 1 


CC 
a 构造 生产 的 不 合格 的 PCCP 节 样 本 百分率 p B. 


b. 确定 p 图 中 心 线 的 位 置 . 
c. 确定 p 图 控制 上 下 限 的 位 置 . 过 程 受 控 吗 ? 


16.28 不 合格 的 保险 丝 . 计算 机 终端 保险 丝 的 制造 


商 希 望 构造 一 个 控制 图 来 监测 生产 过 程 . 在 25 h 期 
间 内 已 知 过 程 是 受 控 的 ， 质量 控制 工程 师 每 小 时 
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£ 


从 生产 线 上 随机 选取 100 根 保险 丝 进 行 试验 , id . 对 阴极 射线 管 样本 的 不 合格 品 率 构造 p 图 . 





AM 1 2 3 4 s e 7 s s y “确定 p 图 控制 上 下 限 的 位 轩 
"EE d. 过 程 受 控 吗 ? MERE, 为 未 来 数据 修正 控 
不 合格 数 6 4 9 3 0 6 4 2 1 2 B. 





PM É » » 5 > » » » ^ e. 进行 游程 分 析 发 现 生产 过 程 中 的 趋势 























小 时 21 22 23 24 25 天 不 合格 数 天 不 合格 数 
不 合格 数 7 9 2 10 3 1 11 12 23 
a. 为 不 合格 终端 保险 丝 的 样本 百分率 构造 上 图 ? ) B » 
b. 确定 p 图 中 心 线 的 位 置 3 12 14 B 
c. 确定 图 控制 上 下 限 的 位 置 . 过 程 受 控 吗 ? 4 10 I5 1 
d. 对 p 图 中 的 点 进行 游程 分 析 , 这 说 明了 什么 ? 5 9 16 11 
e. 假如 紧 接 着 从 生产 线 上 选取 的 一 个 100 个 终端 6 12 17 16 

保险 丝 样本 中 有 11 个 不 合格 ， 此 时 过 程 受 控 7 12 18 15 
nj? 请 解释 . 8 14 19 10 
16.29 阴极 射线 管 . 电子 公司 在 一 个 大 规模 的 生产 基 9 ° 20 13 
地 制造 几 类 阴极 射线 管 . 为 了 监测 这 个 过 程 , 在 1 个 10 13 z1 12 
月 内 , 每 天 从 生产 线 上 随机 抽样 50 支 某 种 类 型 的 电 " i5 
子 管 进行 检查 , 每 天 发 现 的 不 合格 数 如 下 表 所 示 . 





16.7 ”每 个 个 体 缺 陷 数 控制 图 : c 图 


除了 各 种 不 同 的 质量 特征 , 我 们 可 能 还 对 包含 在 每 个 单个 产品 中 的 缺陷 或 环 间 数 感 兴趣 例如 ， 
一 个 办 公家 具 的 制造 商 每 隔 15 分 钟 从 生产 线 上 随机 抽样 一 件 家 具 ， CREE DS Ru) ak. 类 似 
地 ， 纺 织品 制造 商 每 小 时 随机 抽取 一 块 一 平方 英尺 的 布料 检查 ,记录 其 上 的 小 缺陷 个 数 . 这 样 做 的 
目的 是 监测 每 个 个 体 的 缺陷 数 并 且 发 现 这 个 变量 失控 的 情形 . 用 质量 控制 的 符号 ， 每 个 个 体 的 缺陷 
数 用 符号 来 表示 , 用 于 监测 这 个 变量 随时 间 变 化 的 控制 图 叫做 c 图 . 
泊 松 概率 分 布 (4. 10 节 ) 为 包含 在 某 工 业 产品 中 的 缺陷 数 c 的 概率 分 布 提供 了 一 个 很 好 的 模型 ， 
根据 4. 10 节 , AJ c 服从 参数 为 的 泊 松 概率 分 布 ,那么 
E(c) 2A 
并 且 
o. - X 
为 了 构造 c 图 , 在 个 等 间隔 的 时 间 点 观测 c, 其 中 & 是 一 个 合理 的 大 值 , 利用 。 D 2 来 估 
WF A. 那么 因为 E(c) =A, 我 们 取 * 图 的 中 心 线 的 位 置 为 : 





Ci 





中 心 线 : c= = 
控制 上 下 限 距 离 中心 线 上 下 3o, (H3 Jk iT) Ab. 所 以 ， 控制 上 下 限 的 位 置 在 ; 
UCL: c +3 /c 


LCL: c -34c 
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c 图 中 心 线 和 控制 图 的 位 置 
中 心 线 : z UCL: e+3J/c LCL; c-3./c 


其 中 ,k= 抽样 的 时 间 段 个 数 , c; = 在 时 段 i 观 测 到 的 每 个 个 体 的 缺陷 数 ,c = 2 vk = 所 有 时 间 段 内 观测 
到 的 每 个 个 体 的 平均 缺陷 数 . 














在 20h 内 , 由 质量 控制 检查 员 每 小 时 从 某 织 布 机 上 随机 选取 一 平方 米 的 毛纺 织品 样品 进 
行 检查 ,并 且 记 录 发 现 的 明显 的 缺陷 数 ,结果 如 表 16.4 所 示 . 假定 每 平方 米 的 缺陷 数 近 似 服从 泊 松 
概率 分 布 , PADS c 图 来 监测 纺织 品 的 生产 过 程 . 

解 第 一 步 是 估计 每 平方 米 毛纺 织品 的 平均 缺陷 数 和 A, 这 个 值 s 也 表示 控制 图 的 中 心 线 : 








¿- LS Ei ss 表 16.4 例 16.6 的 连续 20 在 毛纺 织品 
n 20 样品 中 观测 到 的 缺陷 数 
然后 , 计算 控制 上 下 限 如 下 : 小 时 1 2 3 4 5 6 7 8 9 10 
UCL 2 c 4 3c =7. 55 4 34/1. 55 =15.79 缺陷 数 11 14 10 8 3 9 102 5 6 
LCL 2c -34€ 27.55 -3//7.55 = -0.69 小 时 11 12 13 14 15 16 17 18 19 20 


因为 不 可 能 观测 到 负 的 缺陷 数 , 所 以 LCL 上 调 为 0 PER 12 3 4 5 6 8 Ú 8 7 9 
这 些 数据 的 控制 图 在 图 16. 12 的 MINITAB 输出 中 给 出 . 按照 现行 标准 ,如 果 每 平方 米 的 缺陷 数 没 
有 超过 15，, 纺织 过 程 产生 的 毛纺 织品 缺陷 数 是 允许 的 , 在 20 h 内 没有 出 现 使 过 程 失 控 的 时 间 . 
然而 , 在 我 们 推断 过 程 为 受 控 之 前 , 应 该 检查 缺陷 数 随时 间 的 变化 趋势 ， 即 应 该 进行 16. 5 35488 
述 的 游程 分 析 . 利用 符号 ” +” Ri“ - "分别 表示 落 在 中 心 线 的 上 侧 和 下 侧 的 点 ,得 到 如 图 16. 13 所 示 的 
游程 序列 . 注意 序列 中 的 极端 游程 (游程 1 和 游程 6) 只 包含 4 个 点 , 16. 5 节 中 给 出 的 各 种 不 大 可 能 的 序 
列 没有 一 个 发 生 . 因此 , 数据 中 没有 显示 任何 趋势 . 直到 这 时 ,我们 才 推断 过 程 是 受 控 的 . 


C Chart of DEFECTS 
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Kd 16.12 例 16.6 中 每 平方 米 缺 陷 数 的 MINITAB c 
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图 16.13 图 16.12 的 c 图 中 k=20 个 缺陷 数 的 游程 














解释 c 图 
过 程 “ 失 控 ”; 一 个 或 多 个 样本 缺陷 数落 在 控制 限 以 外 . 这 表示 生产 过 程 可 能 存在 问题 ,需要 进一步 
调查 . 
过 程 “ 受 控 ”: 所 有 样本 缺陷 数 都 落 在 控制 限 以 内 . 此 时 ，, 最 好 是 不 管 过 程 ， 不 要 去 寻找 可 能 不 存在 的 
问题 . 
应 用 练习 观测 到 的 调 准 错误 的 总 数 , 如 下 表 所 示 . 


16.30 mds xU. 在 制造 定做 的 木 柜 面 板 时 , m: 
疫 ( 刮 痕 、 缺 口 、 裂 矣 、 水 泡 ) 数 对 于 消费 者 和 制造 
者 都 是 重要 的 . 为 了 监测 制造 过 程 , 在 连续 15 个 
小 时 中 , 每 小 时 选 出 一 块 已 经 完成 的 4 在 乘 以 8 如 
的 面板 , 检查 其 瑕 病 数 , 每 块 面板 上 的 瑕 疫 数 记录 
EFK. 


———  T.x _ lll _ 
KR 123456789 10 II 12 13 14 15 
HE 4233945387 3 6 5 7 3 
— ——— _ - —  _ C — 


TE c Eel rfi tH EBERT RER. 

.确定 c 图 中 心 线 的 位 置 . 

确定 c 图 的 控制 上 下 限 位 置 ,过程 受 控 吗 ? 

. 对 图 进行 游程 分 析 , 这 说 明了 什么 ? 

16. 31 计算 机 模块 编码 错误 . 计算 机 程序 设计 组 的 
主管 承担 一 项 质量 控制 研究 . 在 最 近 20 天 内 , 每 
天 随机 选取 25 个 程序 模块 检查 其 中 的 编码 错误 ， 
每 天 观测 到 的 错误 数 记录 在 下 表 . 

天 1 2 3 4 5 6 7 8 9 10 
编码 错误 7 3 9 8 2 S 10 5 7 6 
天 11 12 13 14 15 16 17 18 19 20 
编码 错误 1 4 11 8 6 6 92 12 9 
一 一 -~ 2 99 9212 9 


° p 


ap 








a. 在 c 图 中 画 出 每 天 的 编码 错误 数 . 
b. 确定 图 中 心 线 的 位 置 . 
c. 确定 图 的 控制 上 下 限 位置 , 过 程 受 控 吗 ? 
d. 对 图 进行 游程 分 析 , 这 说 明了 什么 ? 
16.32 飞机 的 调 准 . 某 种 飞机 模型 易 受 到 制造 过 程 
中 的 调 准 错误 的 影响 . 为 了 监测 这 个 过 程 , 对 于 先 
完成 的 25 架 飞 机 中 的 每 架 进 行 最 后 的 检查 ,记录 








飞机 调 准 错误 数 飞机 调 准 错误 数 
1 7 14 

2 6 15 8 
3 6 16 15 
4 7 17 6 
5 4 18 4 
6 7 19 13 
7 8 20 7 
8 12 21 8 
9 9 22 15 
10 9 23 6 
11 8 24 6 
12 5 25 10 
13 5 





资料 来 源 : Grant, E. L. , and Leavenworth, R. S. , Statisti- 
cal Quality Control, 5th ed. New York; McGraw-Hill, 1980 
(38-1). Reprinted with permission. 


a. 为 每 架 飞机 的 调 准 错误 个 数 构造 c 图 . 

b. 在 c 图 中 确定 中 心 线 和 控制 上 下 限 的 位 置 . 

e. 过程 受 控 吗 ? 对 未 来 的 数据 , 建议 使 用 这 些 控 
制 限 吗 ? 


16. 33 飞机 调 准 ( 续 ). 参考 练习 16.32. 对 于 接着 


生产 的 25 3R EL, 每 架 观 测 到 的 调 准 错误 数 如 下 

表 中 所 示 . 

a. 在 练习 16. 32 BJ c 图 中 添加 这 25 个 点 , 过 程 仍 
受 控 吗 ? 

b， 对 修正 的 。 图 进行 游程 分 析 , 发 现 了 什么 ? 
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飞机 调 准 错误 数 飞机 调 准 错误 数 飞机 调 准 错误 数 飞机 调 准 错误 数 

















H 
26 7 33 6 40 8 47 9 
27 13 34 7 41 10 48 11 
28 4 35 14 42 8 49 11 
29 5 36 18 43 7 50 8 
30 9 37 11 44 16 
31 3 38 11 45 13 
32 4 39 11 46 12 











资料 来 源 : Grant, E. L. , and Leavenworth, R. S. , Statistical Quality Control, 5th ed. New York, McGraw-Hill, 1980( Æ 8-1). Re- 


printed with permission. 


16.8 容许 限 


前 几 节 介绍 的 休 险 特 控制 图 总 体 上 为 生产 过 程 的 质量 提供 了 有 价值 的 信息 . 然而 , 即使 认为 过 
程 似 乎 是 受 控 的 ， 单个 制造 品 也 不 可 能 总 是 满足 规格 ， 因此 , 除了 过 程控 制 以 外 ， 知道 个 体质 量 测量 
值 的 很 大 比例 以 一 个 很 高 的 置信 度 落 在 某 个 限 内 常常 是 重要 的 . 以 一 个 已 知 的 概率 包含 一 定 百分率 
的 测量 值 的 区 间 叫 做 容许 区 间 ， 区 间 的 端点 叫做 容许 限 . 

除了 努力 获得 的 是 总 体 中 测量 值 的 比率 y, 而 不 是 总 体 参 数 (如 总 体 均 值 AH) 之 外 , 容许 区 间 和 
第 8 章 的 置信 区 间 是 一 样 的 . 例如 ， 生产 主管 可 能 希望 利用 95% 容许 区 间 建 立 生 产 线 上 制造 的 吊环 
螺栓 长 度 测 量 值 的 99% 置信 限 ， 这 里 置信 系数 是 1 -a=0.95， 检查 员 想 要 得 到 的 测量 值 比 率 为 y = 
0.99. 置信 系数 0. 95 和 第 8 章 的 意思 相同 ， 即 每 100 个 相似 构造 的 容许 区 间 , KAA 95 个 将 包含 总 
体 的 99% 长 度 测量 值 . 

定义 16.8 产品 的 100(y)% 质 量 测量 值 的 100(1 - a)% 容许 区 间 是 以 置信 系数 (1 -a) 包含 
100( y) 和 测量 值 的 区 间 . 

定义 16.9 容许 区 间 的 端点 叫做 容许 限 . 

当 产 品 特征 的 测量 值 总 体 服 从 已 知 均值 和 已 知 标准 差 o 的 正 态 分 布 时 ,容易 构造 容许 限 . 事实 
+, 这 样 的 区 间 是 一 个 100% 容许 区 间 , 即 置 信 系 数 是 1.0. 例如 , 假定 上 述 吊环 螺栓 的 长 度 服 从 六 = 
0. 50 in, = 20.01 in 的 正 态 分 布 . 根据 对 标 
准 正 态 (z) 分 布 的 了 解 , 确信 ( 即 以 1 -a= 
1.0 的 概率 )99% 的 测量 值 将 会 落 在 均值 的 
z 22.58 的 标准 差 之 内 ( 见 图 16. 14). 所 以 ， 
99% 长 度 测量 值 的 100% 容许 区 间 是 ， 

人 +2.58o =0. 50 +2. 58(0.01) 

=0. 50 +0. 0258 — 
或 (0. 4742, 0. 5258). (04242) 
实际 上 , 质量 控制 工程 师 很 少 知道 
fl e 的 真 值 . 幸运 的 是 可 以 用 样本 估计 什 H6 14 RGRIBEEI HEUS TE) 
AI s HAMRE u 和 来 构造 容许 区 间 . 然而 由 于 样本 估计 值 引起 的 误差 , 容许 区 间 的 置信 系数 不 再 
等 于 1.0. 为 测量 值 的 正 态 总 体 构造 容许 限 的 过 程 如 下 面 所 示 . 


0.99 






m H + 2.58; 
(0.50) (0.5258) 
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正 态 总 体 测量 值 的 容许 区 间 
正 态 总 体 10026 测量 值 的 100(1 - o) 96 容许 区 间 是 : 
x + s 
其 中 ,元 = 个 测量 值 的 样本 均值 , s = 样本 标准 差 . 
基于 置信 系数 (1 -a), y RUE E n i KETAK B. 20 找到 . 
假定 : 测量 值 的 总 体 是 近似 正 态 的 . 























参考 例 16.2, 利用 表 16. 2 提供 的 样本 信息 求 制造 过 程 生产 的 99% 的 轴 直 径 的 95% 容许 
KE. 假定 轴 直 径 的 分 布 是 近似 正 态 的 . 

AR 表 16.2 包 含 20 个 样本 的 直径 , 每 个 样本 有 4 个 轴 , B3E n = 80 个 轴 直 径 . 80 个 直径 
描述 性 统计 量 的 SPSS 输出 如 图 16. 15 所 示 , 全 部 样本 的 平均 直径 是 = 1. 50043 , 在 输出 中 着 重 
显示 .注意 这 和 例 16.2 中 的 中 心 线 # 的 值 是 相同 的 . ) 样 本 标准 差 (也 在 图 16. 15 中 着 重 显示 ) 是 
s = 0. 009246. 

因为 我 们 需要 99% 轴 直径 的 容许 区 间 , y =0. 99， 又 置信 系数 为 1 - a =0.95. 3 B. 20 XE y 
和 1-a 给 出 了 天 值 . 


Descriptive Statistics 


Std. 
| | v [n [waw | gs | 


Valid N (listwise) 
图 16.15 # 16.7 中 轴 直 径 的 SPSS 描述 性 统计 量 








当 y=0.99, 1 -œa =0.95, n=80 时 , Æ 20 48 K =2. 986. 那么 95% 容许 区 间 是 : 
x +2.986s = 1. 50043 + (2. 986) (0. 009246) =1. 50043 +0. 02761 


sk (1. 47282, 1.52804). 所 以 , 99% 轴 直 径 的 95% 容许 下 限 和 上 限 分 别 是 1. 47282 in 和 1 52804 in. 我 们 
信任 这 种 方法 是 基于 一 个 前 提 , 这 个 前 提 是 每 100 个 类 似 构 造 的 容许 区 间 ,大约 有 95 个 包含 总 体 的 
99% 轴 直 径 . 

用 于 例 16. 7 的 方法 给 出 了 测量 值 正 态 分 布 的 容许 限 . 如 果 我 们 不 愿意 或 不 能 做 正 态 性 的 假定 ， 
那么 必须 采取 非 参 数 方法 . 非 参 数 容许 限 仅 基于 样本 数据 中 最 小 和 最 大 的 测量 值 ， 如 下 面 框 格 所 示 . 
这 些 容许 区 间 可 以 应 用 到 测量 值 的 任意 分 布 . 





非 参数 容许 区 间 
A wnn 和 x 分 别 表示 来 自 测量 值 任意 分 布 的 大 小 为 n 的 样本 中 最 小 和 最 大 观测 值 , 那么 可 以 选择 一 个 
n E (rs, num) 形成 包含 至 少 100y% 总 体 的 100(1 - ae)% 容许 区 间 . 对 于 置信 系数 (1 — a) fo y 的 其 些 
f&, # B.21 给 出 了 nn 值 . 





参考 例 16.7. 为 使 区 间 (xmis，xaax ) 成 为 由 制造 过 程 生产 的 至 少 90% 轴 直 径 的 95% 容许 
KE, 求 所 需 样本 大 小 . 
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E 这 里 置信 系数 是 1 -a=0.95, 我 们 想 要 得 到 的 测量 值 比例 是 y =0. 90. 由 表 B.21 可 知 , 相 
应 于 1-a=0.95, 和 y=0.90 的 样本 大 小 是 n=46. 因此 , 如 果 随 机 抽取 n=46 根 轴 , 那么 样本 中 最 
小 和 最 大 直径 分 别 表示 置信 系数 为 0. 95 的 至 少 90% 的 轴 直 径 的 容许 下 限 和 上 限 . 

由 容许 区 间 提 供 的 信息 常常 用 于 确定 是 否 满足 产品 规格 . 和 容许 限 及 控制 限 不 一 样 , 规格 限 不 
是 由 对 过 程 的 抽样 来 决定 的 , 而 是 由 顾客 、 管 理 人 员 和 /或 产品 设计 人 员 规 定 的 质量 变量 的 合格 什 
为 了 确定 规格 是 否 现 实 , 规格 限 与 由 抽样 得 到 的 容许 限 , 即 与 过 程 “自然 "容许 限 比较 . 如 果 容 许 限 
没有 落 在 规格 限 内 ,强烈 建议 再 次 考察 生产 过 程 . 一 项 调查 说 明 ， 比 产品 功能 必需 更 加 严格 的 规格 
应 该 放宽 . 或 者 如 果 规格 不 能 改变 , 那么 为 了 减少 产品 的 变异 性 , 有 必要 对 生产 过 程 做 一个 基本 
改变 . 
定义 16. 10 ”规格 限 是 对 某 种 产品 或 服务 输出 变量 ( 即 对 质量 特征 ) 规 定 可 接受 值 的 边界 点 ,规格 限 
由 顾客 、 管 理 人 员 和 产品 设计 人 员 决 定 . 规格 限 可 能 是 有 上 下 限 的 双 侧 限 , 也 可 能 是 只 有 上 限 或 下 


限 的 单 侧 限 . 


应 用 练习 

16.34 HAKE. 参考 练习 16.7, 利用 所 有 的 样 
本 信息 求 90% 撞 针 长 度 的 95% 容许 区 间 , 假定 挤 
针 长 度 的 分 布 是 近似 正 态 的 . 

16.35 ”机 器 人 夹 错 的 空隙 宽度 . 参考 练习 16.9. 

a. 利用 所 有 的 样本 信息 求 90% 空隙 宽度 的 95% 
容许 区 间 , 假定 空隙 宽度 的 分 布 是 近似 正 
态 的 . 

b， 规 格 要 求 夹 钳 的 空隙 宽度 落 在 0.054 + 0. 004 in 
内 , 根据 过 程 的 “自然 ” 容许 限 ( 即 a 的 容许 
限 ) ， 它 满足 规格 吗 ? 

c. 构造 至 少 95% 23 B $ë BE RO 95% 非 参数 容许 区 间 
需要 多 大 的 样本 ? 如 果 此 时 足够 大 ,给 出 非 
参数 容许 限 . 

16.36 ”可 变 电 阻 器 的 旋钮 插入 . 参考 练习 16.11, 
求 至 少 95% 距离 测量 值 的 99% 容许 区 间 ， 假 定 以 
下 情况 ， 

a. IEZS 2 fg. 

b， 非 正 态 分 布 . 

16.37 顾客 投诉 研究 ，J. Namias 利用 统计 质量 控制 
技术 确定 寻找 顾客 投诉 一 家 饮料 公司 的 具体 原因 
(Journal of Marketing Research, 1964 年 8 月 ). 
Namias 发 现 ， 当 过 程 受 控 时 , 瓶装 产品 的 两 周 投诉 
率 ( 即 在 2 周 内 每 销售 出 10 000 瓶 饮料 , 顾客 的 投 
诉 数 . ) 近 似 服从 j=26, o =11.3 的 正 态 分 布 . 顾客 
投诉 主要 集中 在 有 点 危险 的 带 缺 口 瓶子 . 

a. 假定 装 瓶 过 程 受 控 , R 99% 投诉 率 的 容许 限 ， 
区 间 的 置信 系数 是 多 少 ? 请 解释 . 

b. 在 2 周 内 , 每 售 出 10 000 瓶 饮 料 观测 的 投诉 率 


为 93. 12. 基于 掌握 的 统计 质量 控制 知识 , 认为 
观测 的 比率 是 由 于 偶然 原因 还 是 某 些 特殊 的 原 
因 ? (实际 上 寻找 装 瓶 过 程 可 能 问题 时 , 发 现 新 
雇用 的 工人 在 仓库 中 对 瓶装 饮料 粗野 搬运 ， 所 
以 应 该 制定 新 工人 培训 计划 . ) 

16.38 技工 的 手工 工具 . 技工 使 用 的 许多 手工 具 包 
含 适合 搬 座 (如 管 钳子 ) 的 附件 . 在 工具 制造 中 , 规 
格 要 求 插座 的 内 直径 大 于 插 人 物 的 外 直径 ， 即 必 
须要 有 足够 的 空隙 使 得 插 和 信物 能 够 适合 插座 , 为 
了 建立 工具 的 容许 限 , 从 生产 过 程 中 选 出 50 个 插 
座 和 50 个 附件 的 独立 随机 样本 , 测量 直径 (插座 
的 内 径 和 插入 物 的 外 径 ). 分 析 说 明 二 者 尺寸 的 分 
布 都 是 近似 正 态 的 , 两 个 样本 的 均值 和 标准 差 (in) 
在 下 表 中 给 出 . 

— _ 





插座 (1) 附件 (2) 
样本 均值 0. 5120 0. 5005 
标准 差 0.0010 0. 0015 


a. 求 99% 插 座 直 径 的 95% 容许 区 间 . 

b. 求 99% 附 件 直径 的 95% 容许 区 间 . 

c. 规格 要 求 附件 和 插座 间 的 空 阶 ( 即 插座 内 直径 
和 附件 外 直径 的 差 ) 至 少 是 0. 004 in. 根据 a Fl b 
中 的 容许 限 , 可 能 找到 一 个 插入 物 和 插座 , 使 
具有 小 于 要 求 的 0. 004 in 最 小 空隙 ? 

d. 规格 也 要 求 附件 和 插座 的 最 大 距离 是 0. 015 in, 
以 防止 太 宽 松 , 根据 a RI b 中 的 容许 限 , 期 望 找 
到 某 对 太 宽 松 的 附件 和 插座 吗 ? 

e. 参考 d, 计算 观测 到 宽松 插入 的 近似 概率 . ( 提 
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T: 利用 插座 内 直径 和 附件 外 直径 的 差 近似 服 为 -jm， WEZH oi +o2( 由 定理 6.6). ) 
从 正 态 分 布 (因为 两 个 分 布 都 是 正 态 的 ) , 均值 


"16.9 能 力 分 析 


正如 在 前 几 节 所 看 到 的 那样 ,达到 过 程 稳定 对 于 过 程 改进 的 结果 是 非常 重要 的 , 但 是 这 并 不 
是 它 本 身 的 结束 . 过 程 可 能 是 统计 受 控 的 , 但 是 高 度 的 变异 可 能 没有 能 力 生 产能 被 顾客 接受 的 
产品 . 

为 了 说 明 这 一 点 ,考虑 图 16.16, 这 个 图 上 显示 了 6 个 不 同 的 受 控 过 程 . 回忆 如 果 过 程 是 统计 受 
控 的 , 它 的 产品 分 布 就 不 会 随时 间 而 改变 , 像 其 中 的 每 一 个 图 一 样 ， 过 程 可 以 用 单个 概率 分 布 描述 . 
6 个 过 程 中 每 一 个 产品 的 上 下 规格 限 , 即 产品 变量 的 目标 值 , 也 都 在 每 个 图 中 说 明 ， 回忆 定义 16. 10, 
规格 限 是 确定 输出 变量 接受 值 的 边界 点 . 

图 16. 16a、b RI c 的 过 程 引起 落 在 规格 限 外 的 个 体 比 例 很 高 ， 这 些 过 程 没 有 一 个 具有 使 它 的 消 
费 者 满意 的 能 力 . 在 图 16. 16a 中 , 过程 的 中 心 是 目标 值 ， 但 是 由 通常 原因 引起 的 变异 太 大 ; 在 图 
16. 16b 中 ,相对 于 规格 限 的 宽度 , 变异 是 小 的 , 但 是 过 程 偏 离 中 心 ; 在 图 16. 16c rp, 两 个 问题 都 存 
E: 不 但 变异 , 过 程 还 偏离 中 心 . 所 以 ， 使 过 程 处 于 统计 控制 中 不 足以 保证 过 程 的 能 力 . 

图 16. 16d, e 和 f 中 的 三 个 过 程 都 是 有 能 力 的 . 在 每 种 情形 下 ， 过 程 分 布 都 可 以 在 规格 限 之 间 
很 好 的 拟 合 , EKE, 由 这 些 过 程 生产 的 所 有 单个 个 体 都 是 可 接受 的 . 然而 , 由 顾客 或 内 部 经 理 
或 工程 师 提出 的 规格 限 的 任何 显著 的 严格 都 会 导致 不 合格 产品 产生 ， 且 有 必要 开始 过 程 改 进 活动 
来 修补 过 程 的 能 力 . 进一步 , 即使 过 程 是 有 能 力 的 ， 但 是 过 程 的 连续 改进 需要 它 的 能 力 不 断 地 
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图 16. 16 6 个 不 同 受 控 的 过 程 的 产品 分 布 , Hob LSL = 规格 下 限 ， USL = 规格 上 限 


在 本 节 中 , 我 们 提出 一 种 叫做 能 力 分 析 的 方法 ， 是 为 评价 过 程 的 能 力 而 设计 的 . 当 过 程 已 知 受 
控 时 , 评价 过 程 能 力 的 最 直接 方法 是 为 来 自 过 程 的 大 样本 个 体 测量 值 (通常 是 50 或 更 多 ) , 构造 频 
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率 分 布 (如 点 图 、 直 方 图 或 者 茎 叶 图 ) ,然后 在 图 上 添加 输出 变量 的 规格 限 和 目标 值 ， 这 叫做 能 力 分 
WE, 是 评价 过 程 能 力 时 最 简单 的 图 形 工具 . 
在 油漆 制造 过 程 中 , 用 相同 的 压 注 嘴 连 续 地 向 1 加 仑 的 油漆 们 注入 油漆 . 为 了 监测 这 个 
过 程 , 决定 在 楼 下 来 的 25 h 内 每 小 时 一 次 抽取 5 个 连续 的 缸 , 测量 每 个 钠 的 重量 (1b)， 样本 数据 如 
表 16. 5 所 示 . 规格 重量 是 在 9.995 ~ 10. 005 了 b 之 间 ， 目 标 重量 是 10 Db. 为 这 组 数据 构造 能 力 分 析 图 ， 
并 解释 结 

解 图 16.17 所 示 的 MINITAB 直方 图 是 对 125 个 重量 的 总 样本 的 能 力 分 析 图 可 以 看 到 过 程 大 
约 以 10 Ib 油漆 的 目标 为 中 心 , 但 是 大 量 油漆 铅 落 在 规格 限 外 ( 如 图 16. 17 的 左下 方 所 示 , 有 12. 8% 
在 9.995 以 下 , 有 11.2% 在 10.005 ME), 这 说 明 过 程 没 有 能 力 满足 顾客 需要 . 


表 16.5 来 自 油漆 装 料 过 程 的 大 小 为 5 的 25 个 样本 





É 本 测 量 值 
1 10. 0042 9.9981 10. 0010 9. 9964 10. 0001 
2 9. 9950 9. 9986 9. 9948 10. 0030 9. 9938 
3 10. 0028 9. 9998 10. 0086 9. 9949 9. 9980 
4 9. 9952 9. 9923 10. 0034 9. 9965 10. 0026 
5 9. 9997 9. 9983 9. 9975 10. 0078 9. 9891 
6 9. 9987 10. 0027 10. 0001 10. 0027 10. 0029 
7 10. 0004 10. 0023 10. 0024 9. 9902 10. 0135 
8 10. 0013 9. 9938 10. 0017 10. 0089 10. 0001 
9 10. 0103 10. 0009 9. 9969 10. 0103 9. 9986 
10 9. 9980 9. 9954 9. 994] 9. 9958 9. 9963 
11 10. 0013 10. 0033 9. 9943 9. 9949 9. 9999 
i2 9. 9986 9. 9990 10. 0009 9. 9947 10. 0008 
13 10. 0089 10. 0056 9. 9976 9. 9997 9. 9922 
14 9.9971 10. 0015 9. 9962 10. 0038 10. 0022 
15 9. 9949 10. 0011 10. 0043 9. 9988 9. 9919 
16 9. 995] 9. 9957 10. 0094. 10. 0040 9. 9974 
17 10. 0015 10. 0026 10. 0032 9. 9971 10. 0019 
18 9. 9983 10. 0019 9. 9978 9. 9997 10. 0029 
19 9. 9977 9. 9963 9. 9981 9. 9968 10. 0009 
20 10. 0078 10. 0004 9. 9966 10. 0051 10. 0007 
21 9. 9963 9. 9990 10. 0037 9. 9936 9. 9962 
22 9. 9999 10. 0022 10. 0057 10. 0026 10. 0032 
23 9. 9998 10. 0002 9. 9978 9. 9966 10. 0060 
24 10. 0031 10. 0078 9. 9988 10. 0032 9. 9944 


25 9. 9993 9. 9978 9. 9964 10. 0032 10. 0041 
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| ur s ji z E 
图 16.17 油漆 装 料 过 程 的 MINITAB 能 力 分 析 图 

大 多 数 质量 管理 专家 和 统计 学 家 都 认为 能 力 分 析 图 是 描述 受 控 过 程 性 能 的 最 好 方法 , 然而 , VE 
多 质量 工程 师 发 现 对 能 力 的 一 个 数值 度量 是 有 用 的 . 有 几 种 不 同 的 方法 来 为 能 力 定量 , 我 们 简要 描 
述 其 中 的 两 种 . 第 一 种 (最 直接 的 ) 是 在 能 力 分 析 图 中 计数 落 在 规格 限 外 的 个 体 数 , 并 且 给 出 这 些 个 
体 在 样本 中 的 百分率 . 如 图 16. 17 所 示 , 例 16. 9 中 抽样 的 125 个 油漆 负 有 24% 落 在 规格 限 之 外 (有 
12. 8% 7E 9.995 以 下 , Æ 11. 296 7E 10.005 以 上 ), 所 以 , 在 125 ^ E BS FE PA 24% (也 就 是 30 个 
RE) 是 不 合格 的 . 

当 这 个 百分率 用 于 描述 过 程 能 力 时 ,意味 着 在 整个 时 间 内 如 果 过 程 保持 受 控 , 油漆 人 护 中 大 约 有 
24% 不 合格 . 然而 , 这 个 百分率 仅 是 一 个 估计 值 , 是 一 个 样本 统计 量 , 而 不 是 一 个 已 知 参数 , 这 是 基 
于 大 小 为 125, 且 具 有 抽样 误差 和 测量 误差 的 样本 . 在 第 7 章 中 详细 讨论 过 这 种 百分率 和 比率 . 

如 果 已 知 过 程 近似 服从 正 态 分 布 , 和 通常 情形 一 样 ,可 以 使 用 相似 的 方法 以 数量 表示 过 程 能 力 . 
此 时 , 用 于 构造 能 力 分 析 图 测量 值 的 样本 均值 和 标准 差 可 以 作为 过 程 均值 和 标准 差 的 估计 . 那么 ， 
落 在 规格 限 之 外 的 个 体 比例 可 以 如 第 5 章 所 做 那样 ,用 求 出 正 态 曲线 下 的 相应 面积 而 得 . 如 上 述 , 如 
果 用 这 个 百分率 来 描述 过 程 能 力 ,一 定 要 注意 这 仅仅 是 一 个 估计 ,， 且 具有 抽样 误差 . 




















度量 能 力 的 第 二 种 方法 是 构造 能 力 指数 , 已 经 提出 了 几 种 这 样 的 指数 , 我 们 将 描述 一 个 用 于 中 
心 在 目标 值 的 稳定 过 程 的 指数 , 这 称 为 C, 指数 S. LSL USL 
当 能 力 分 析 图 表明 过 程 在 中 心 时 , 能 力 可 以 通过 比较 规 | 规格 差 中 


一 一 过程 散布 —— 


格 上 限 (USL) 和 规格 下 限 (LSL) 之 间 的 距离 (叫做 规格 差距 ) 
与 输出 分 布 的 散布 来 度量 . 输出 分 布 的 散布 叫做 过 程 散 布 ， 
定义 为 6o, 用 6s 来 估计 , 其 中 * 是 用 于 构造 能 力 分 析 图 的 测 
量 值 的 样本 标准 差 . 这 两 个 距离 表示 在 图 16. 18 H, 这 个 虐 ” 一 一 下 
离 的 比 称 为 能 力 指数 C, 

定义 16. 11 中 心 在 要 求 的 均值 上 的 过 程 能 力 指数 是 ， ”图 16.18 过程 散 布 与 规格 差距 关系 图 








H H +30 





O ”对 于 偏离 中 心 的 过 程 , 使 用 它 的 姐妹 指数 Cw， 对 于 Ci 的 描述 参考 本 章 文献 . 
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_ 规格 差距 “USL - LSL 
P 过 程 散 布 6o 
其 中 og 是 由 用 于 构造 能 力 分 析 图 测量 值 的 样本 标准 差 ， 估计. 








能 力 指数 C, 的 解释 

C, 汇总 了 稳定 的 、 相 对 于 规格 限 的 中 心 过 程 性 能 ， 它 表明 过 程 的 输出 落 在 规格 限 内 的 程度 . 
L 如果 C, =1( 规 格 差距 = 过 程 散布 ) ,过程 有 能 力 . 
2. 如果 C. >1( 规 格 差距 > 过 程 散 布 ) ， 过 程 有 能 力 ， 
3. 如 果 C. «VUE EE < 过程 散布 )， 过程 没 有 能 力 . 
如 果 过 程 服从 正 态 分 布 ， 

C, =1.00 是 指 每 1000 个 单位 中 将 大 约 有 2.7 个 是 不 合格 的 . 

C, =1.33 是 指 每 百 万 个 单位 中 将 大 约 有 63 个 是 不 合格 的 . 

C, =1. 67 是 指 每 百 万 个 单位 中 将 大 约 有 0. 6 个 是 不 合格 的 . 

C, =2.00 是 指 每 10 亿 个 单 中 位 将 大 约 有 2 个 是 不 合格 的 ， 











在 过 程 (近似 ) 服 从 正 态 分 布 的 实际 应 用 中 , 质量 工程 师 典型 的 要 求 C, 至 少 为 1. 3. C, 为 1 33 的 过 
程 散布 仅 占 据 了 75% 的 规格 差距 , 在 过 程 偏离 中 心情 况 , 会 留 下 一 个 小 的 摆动 空间 . 
让 我 们 回 到 例 16. 9 分 析 的 油漆 装 料 过 程 . 回忆 -- 共 收集 了 ( 见 表 16. 5) 样 本 量 为 5 的 25 
个 样本 (125 个 重量 测量 值 ). Sii nti THESE SE RE MUS TR Je LSL =9. 995 Ib, USL = 10. 005 Ib. 

a， 对 这 个 过 程 构造 能 力 指数 合适 吗 ? 

b. 求 这 个 过 程 的 C,， 并 解释 这 个 值 . 

解 a 首先 , 我 们 证 实 过 程 处 于 统计 受 控 状态 . 把 表 16. 5 的 数据 输入 MINITAB, jk R BILE 
图 , 如 图 16. 19 所 示 的 两 个 控制 图 表明 油漆 装 料 过 程 是 “ 受 控 ”的 . 因为 过 程 是 稳定 的 , 它 的 输出 分 
布 在 任何 时 间 点 都 可 以 用 相同 的 概率 分 布 来 描述 . 因此 ,利用 分 布 和 如 C, 那样 有 关 的 性 能 度量 来 评 
价 过 程 性 能 是 合适 的 . 

b， 由 定义 16. 11， 

C = (USL - LSL) 
P 60 

现在 USL 10.005, LSL -9.995, 但 是 = 是 多 少 呢 ? 因为 不 能 确切 知道 输出 分 布 , 也 不 知道 输出 分 
布 的 标准 差 o, 必须 用 来 自 过 程 的 大 样本 的 标准 差 s 来 估计 o, 在 这 种 情况 下 , 利用 用 于 构造 能 力 分 
析 图 的 125 个 测量 值 的 标准 差 , 这 个 值 s=0.00447 在 图 16. 17MINITAB 输出 的 左上 方 着 重 显示 
所 以 


c - (10-005 -9.995) — 0.01 
P 6(0.00447) ^ 0.02682 


(这 个 C, 值 也 在 图 16. 17 的 右上 方 着 重 显 示 . ) 因为 C, 小 于 1.0, 过程 是 没有 能 力 的 . 过 程 散布 比 规格 
差距 要 宽 , 所 以 C, 统计 量 证 实 了 能 力 分 析 图 (图 16. 17) 中 的 结果 ,在 抽样 继 中 有 24% 是 不 合格 的 . 

有 两 个 原因 使 得 在 使 用 和 解释 C, 时 必须 非常 小 心 , 第 一 ,与 用 于 它 的 计算 中 的 样本 标准 差 。_ 
PE, C, 是 一 个 统计 量 , 会 受到 抽样 误差 的 影响 ， 即 C, 的 值 是 随 着 样本 的 变化 而 改变 的 . 所 以 ,除非 
知道 抽样 误差 的 大 小 , 在 比较 不 同 过 程 的 C, 时 应 该 非常 小 心 . 第 二 ，C, 不 反映 输出 分 布 的 形状 ,不 





=0.373 
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同形 状 的 分 布 可 以 有 相同 的 C, 值 . 所 以 , C, 不 应 该 单独 使 用 , 而 应 该 和 能 力 分 析 图 结合 使 用 . 
如 果 能 力 分 析 研 究 说 明 - 个 受 控 的 过 程 像 油漆 装 料 例子 那样 , 是 没有 能 力 的 , 其 原因 通常 是 变 
F, 而 不 是 偏离 中 心 . 所 以 , 常常 是 通过 寻找 并 消除 引起 变异 的 一 般 原因 ， 达到 或 恢复 能 
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应 用 练习 

16. 39 确定 规格 限 . 一 个 受 控 、 中 心 的 过 程 服从 正 
态 分 布 , 并 且 C, = 2.0, 规格 上 限 离 过 程 均值 有 多 
少 个 标准 差 ? 

16.40 RC. 一 个 受 控 过 程 的 输出 分 布 是 均值 为 
1 000 ,标准 差 为 100 的 正 态 分 布 , 过 程 的 规格 上 下 
限 分 别 是 1020 和 980. 

a. 假定 过 程 性 能 没有 改变 , 那么 输出 的 多 大 百 分 
率 是 不 合格 ? 
b. 求 过 程 的 C, 值 , 并 解释 . 

16. 41 ORA HUE. 参考 练习 16.2, Mining Engi- 
neering ( 2004 年 10 月 ) 对 生产 高 质量 铁 块 的 新 技术 
的 研究 . 33 个 时 间 区 间 生 产 的 铁 块 中 碳 的 百分比 
变化 的 数据 保存 在 CARBON2 文件 中 , 规定 碳 含量 
应 该 在 3.42 +0.3% 之 间 . 

a 为 炼 铁 过 程 构造 能 力 分 析 图 . 
b. 确定 碳 测量 值 落 在 规格 之 外 的 比例 . 
c. 求 过 程 的 能 力 指 数 并 解释 这 个 值 . 

16.42 ARRIE. 一 台 机 器 把 小 麦 玉米 麦片 装 

ARF, 装 盒 的 目标 重量 是 24 #7. 为 了 监测 这 个 





天 麦片 盒子 重量 (次 司 ) 
1 24.02 23.91 24.12 24.06 24.13 
2 23.89 23.98 24.01 24.00 23.91 
3 24.11 24.02 23.99 23.79 24. 04 
4 24.06 23.98 23.95 24.01 24.11 
5 23.81 23.90 23.99 24.07 23. 96 
6 23.87 24.12 24.07 24.01 23. 99 
7 23.88 24.00 24.05 23.97 23.97 
8 24.01 24.03 23.99 23.9] 23. 98 
9 24.06 24.02 23.80 23.79 24. 07 
10 23.96 23.99 24.03 23.99 24.01 
11 24.10 23.90 24.11 23.98 23.95 
12 24.01 24.07 23.93 24.09 23. 98 
13 24.14 24.07 24.08 23.98 24.02 
14 23.91 24.04 23.89 24.01 23.95 
15 24.03 24.04 24.01 23.98 24.10 
16 23.94 24.07 24.12 24.00 24.02 
17 23.88 23.94 23.91 24.06 24. 07 
18 24.11 23.99 23.90 24.01 23. 98 
19 24.05 24.04 23.97 24.08 23. 95 


20 24.02 23.96 23.95 23.89 — 24.04 

— 28.02 29.96 23.95 23.89 ^ 2404 — 
过 程 ,从 每 天 的 产品 中 随机 抽样 5 盒 并 测量 其 重 
BL, 连续 20 天 的 数据 在 练习 16. 42 的 表 中 给 出 . 假 
定 重 量 的 规格 限 是 USL = 24. 2 AAJ, LSL = 23.8 
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di ri]. 度数 据 如 表 所 示 , 管理 者 设 定 的 规格 上 下 限 分 别 
a. 假定 过 程 受 控 , 构造 过 程 的 能 力 分 析 图 . 为 37 cm 和 35 cm. 
b. 过 程 有 能 力 吗 ? 用 能 力 的 数值 度量 来 证 实 答案 . a 假定 过 程 受 控 , 构造 过 程 的 能 力 分 析 图 . 


16. 43 JH X RAT. 精密 零件 制造 商 生 产 军 用 飞 b. 求 落 在 规格 限 之 外 的 螺钉 的 百分率 . 
机 的 螺钉 , 在 连续 的 25 h 内 ,公司 每 小 时 抽样 4 个 c. 求 能 力 指数 C. 
连续 生产 的 螺钉 , 测量 每 个 螺钉 的 长 度 , 螺钉 的 长 d. 过程 有 能 力 吗 ?解释 . 





小 时 螺钉 长 度 (cm) 小 时 螺钉 长 度 (cm) 
I 37.03 37. 08 36. 90 36. 88 14 37. 08 37.07 37.10 37.04 
36. 96 37.04 36. 85 36. 98 15 37.03 37.04 36. 89 37.01 
3 37.16 37.11 36. 99 37.01 16 36.95 36. 98 36. 90 36. 99 
4 37.20 37. 06 37.02 36. 98 17 36. 97 36. 94 37. 14 37. 10 
5 36. 81 36. 97 36.91 37.10 18 37.11 37.04 36. 98 36.91 
6 37.13 36. 96 37.01 36. 89 19 36. 88 36. 99 37.01 36. 94 
7 37.07 36. 94 36. 99 37. 00 20 36. 90 37.15 37. 09 37.00 
8 37.01 36.91 36. 98 37.12 21 37.01 36. 96 37. 05 36. 96 
9 37.17 37. 03 36. 90 37.01 22 37. 09 36. 95 36. 93 37.12 
10 36.91 36. 99 36. 87 37.11 23 37. 00 37.02 36.95 37. 04 
11 36. 88 37.10 37.07 37.03 24 36. 99 37.07 36. 90 37.02 
12 37.06 36. 98 36. 90 36. 99 25 37.10 37.03 37.01 36. 90 








13 36. 91 37.22 37.12 37. 03 


16.10 不 合格 品 的 抽样 验收 


在 前 面 几 节 , 已 经 学 习 了 在 制造 过 程 中 怎样 用 控制 图 来 监测 并 提高 产品 质量 在 产品 制造 出 来 以 
后 , 产品 的 个 体 以 批 来 储存 (或 包装 )， 每 批 包 含 从 两 个 到 几 千 个 个 体 ， 批量 大 小 依赖 于 产品 的 性 质 . e 
在 发 货 之 前 , 经常 利用 第 二 种 统计 工具 ( 抽样 验收 计划 ) 来 减少 运送 给 顾客 的 不 合格 品 个 体 比例 . 

抽样 验收 计划 如 下 进行 . 从 每 批 中 抽样 固定 的 n 个 个 体 和 仔细 检查 ， 判断 每 个 个 体 是 否 是 不 合格 
5h. 如 果 样 本 中 的 不 合格 品 个 数 y 小 于 或 等 于 预先 规定 的 接收 数 a, 那么 就 接收 这 批 产品 . 如 果 不 合 
格 品 个 数 超过 a, 那么 就 拒 收 这 批 产 品 ， 不 许 第 二 次 抽样 ， 或 全 数 检查 ， 或 某 种 其 他 方法 ( 见 图 
16.20). 抽样 计划 的 目的 是 以 很 高 的 概率 接受 并 且 运送 包含 _ 个 小 比例 p 的 不 合格 品 的 批 , 拒绝 并 
且 扣 留 含有 高 比例 不 合格 品 的 批 . 

在 这 一 点 你 可 能 想 知道 为 什么 质量 控制 工程 师 采取 抽样 而 不 是 检查 批 中 的 所 有 个 体 ， 即 为 什么 
不 做 10096 的 检查 呢 ? 

[ | | | Z l | wA _ | 


0 1 2 3 a atl n 
接收 批 拒绝 批 
TS E d Ty 
图 16.20 din 个 个 体 样本 中 的 不 合格 品 个 数 来 接收 或 者 拒绝 批 

首先 , 100% 的 检查 经 常 是 不 实际 或 不 经 济 的 . 其 次 ， 研究 表明 用 抽样 验收 的 装运 产品 质量 常常 比 
100% 检查 好 . 尤其 是 当 要 检查 产品 有 非常 多 个 相似 个 体 时 . 在 100% 检 查 的 情形 下 , 由 于 反复 操作 而 引 

起 检查 员 疫 劳 总 是 一 种 威胁 ,从 心理 上 来 说 ， 当 仪 检查 少数 几 个 个 体 时 ， 工人 更 倾向 于 进行 优质 操作 . 
经 过 考虑 ， 可 能 发 现 用 抽样 验收 决定 接收 或 者 拒绝 一 批 产品 的 过 程 不 过 是 检验 关于 批 不 合格 品 
7E p 的 假设 . 制造 商 (或 顾客 ) 心 中 有 菜 个 批 不 合格 品 率 Po， 叫 做 可 接收 质量 水 平 ( AQL). 如 果 批 不 
合格 品 率 p 在 po = AQL 以 下 ， 认为 批 是 可 接收 的 . 如 果 事 实 上 p =po( 即 实际 上 批 是 可 接收 的 ) , 拒绝 
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Hg: p =Po 

的 概率 a 叫做 生产 方 风险 . 换 句 话说 , 如 果 p =p, 制造 商 ( 生 产 方 ) 将 从 发 货 中 拒绝 100996 的 接收 
批 ， 导 致 重新 抽样 的 花费 等 等 . 

定义 16. 12 ”可 接收 质量 水 平 (AQL ) 是 生产 方 愿 意 容 届 的 不 合格 品 率 的 上 限 po. 

定义 16.13 ”生产 方 风险 是 当 实 际 上 批 不 合格 品 率 等 于 可 接收 质量 水 平 po 时 ， 拒 绝 批 的 概率 
Qa， 用 假设 检验 的 术语 ,生产 方 风 险 是 I 型 错误 的 概率 . 

使 用 方 、 产 品 的 购买 者 也 有 风险 , 即 接 收 包含 高 不 合格 品 率 p 的 批 的 风险 . 使 用 方 心中 常 有 一 个 
批 不 合格 品 率 pi, 这 是 他 或 她 容忍 的 最 大 批 不 合格 品 率 . 接收 包含 不 合格 品 率 p, 的 批 的 概率 B 叫做 
使 用 方 风险 . 

定义 16. 14 使 用 方 风险 是 接收 包含 不 合格 品 率 p 的 批 的 概率 B, 其 中 Pi 是 使 用 方 接受 的 批 不 
合格 品 率 的 上 限 . 用 假设 检验 的 术语 ， 使 用 方 风险 是 了 型 jua 
错误 的 概率 . | 

操作 特性 曲线 是 批 接收 概率 P(4) 对 批 不 合格 品 率 p 的 “Í 
曲线 , 图 16.21 是 一 条 典型 的 操作 特性 曲线 , 它 全 面 地 描述 
了 一 个 抽样 计划 , 给 出 了 当 p =0 时 批 接收 概率 等 于 1; p =1 
HF, 批 接 收 概 率 等 于 0. 随 着 批 不 合格 品 率 p 的 增加 , 批 接收 
概率 P(4) 减 少 一 直达 到 0. 当 p =po 时 , 生产 方 风险 a 等 于 
I -P(4); 当 p=pi FF, 使 用 方 风险 BF P(A). 

定义 16. 15 一 个 抽样 计划 的 操作 特性 (OC) 曲线 是 
一 条 批 接收 概率 P(A) 关 于 批 不 合格 品 率 p 的 曲线 . 

一 个 抽样 计划 的 操作 特性 曲线 可 以 通过 对 批 不 合格 品 0 P P r^ 
E p 的 各 种 值 , 计算 P(4) 来 构造 的 . 如 4.6 节 和 4.9 节 所 图 16. 21 一 个 典型 的 操作 特性 曲线 
XB, 在 来 自 某 批 的 个 个 体 样本 中 的 不 合格 品 个 数 y 的 概率 分 布依 束 于 批量 大 小 N. WEN EKK, 
而 n 相对 于 NN 来 说 是 小 的 , 那么 y 的 概率 分 布 可 以 近似 为 二 项 概率 分 布 (4.6 节 ); 


n 
p(y)- (re y 20,1,2,--,n 


生产 方 风险 














其 中 
q-l-p 
AU. N RB, 而 n 相对 于 入 来 说 是 大 的 , 那么 y 的 概率 分 布 就 是 超 几 何 概率 分 布 (4.9 35), 


MN 
(a) 
其 中 , W= 批 量 大 小 , r= 批 中 的 不 合格 品 个 数 , p = 放 = 批 不 合格 品 率 , n= 样本 容量 , y = 样本 中 不 


合格 品 个 数 . 
对 样本 量 为 n, 接收 数 a 的 抽样 计划 利用 适当 的 概率 分 布 可 以 计算 出 接收 不 合格 品 率 为 p 的 批 
的 概率 : 


p(y) = 


P(A) =P(y&a) =p(0) +p(1) +- +p(a) 
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我 们 将 会 在 下 面 的 例子 中 解释 这 种 方法 . 
| 例 16. 11 | 一 家 金属 垫 片 制 造 商 以 每 批 500 个 运送 某 种 垫 片 . 在 运送 以 前 使 用 的 抽样 验收 计划 是 基 
于 样本 量 n = 10 和 接受 数 a =1. 

a. 如果 AQL 为 0.05, 求生 产 方 风 险 . 

b. 如果 批 不 合格 品 率 p, =0. 20, 求 使 用 方 风 险 

c， 夯 出 这 个 抽样 计划 的 操作 特性 曲线 草图 . 

解 

a 当 p=po =0.05 时 , 生产 方 风险 是 a=1 - P(A). 对 于 N=500, n =10, y 近似 服从 一 项 概率 分 
布 . 那么 , 如 果 事 实 上 p =0.05, 则 有 


P(A) =p(0) +p(1) = (ne 05)9(0.95)19 + (1)c. 05)! (0.95)? =0. 914 


生产 方 风险 是 : 
a=1-P(A) =1 -0.914 =0.086 
这 意味 着 即使 批 不 合格 品 率 如 0. 05 那样 小 ， 生产 方 也 将 以 8. 6% 3E 46 3X — it. 
b， 当 p=0.20 Ef, 使 用 方 风 险 是 6 = P(A); 


B - P(A) =p(0) +p(1) = (9). 2*(.8" + (1). 2.8? =0. 376 


所 以 ,使 用 方 大 约 有 37. 670 风险 接受 不 合格 品 率 等 于 p =0. 20 的 批 . 在 pi =0. 20 Bt, B 那么 大 的 事 
实说 明 这 个 抽样 计划 在 实际 中 是 没有 什么 价值 的 ， P(A) 
计划 需要 建立 在 一 个 较 大 样本 量 的 基础 上 . 1 生产 方 风险 
c 利用 a 和 中 计算 的 两 个 点 , 以 及 p =0 时 了 
P(A) -1; p=1 时 P(4) =0 的 事实 , 可 以 得 到 这 个 抽 
样 计划 的 操作 特性 曲线 草图 . 草图 如 图 16. 22 所 示 . 
实际 上 , 工程 师 不 会 为 特定 批量 大 小 和 AQL 构 05 
造 一 个 抽样 计划 ， 因 为 它们 已 经 构造 好 ,并 使 用 了 
很 多 年 . 最 广泛 使 用 的 抽样 计划 集成 之 一 叫做 军事 标 
准 105D( MIL-STD-105D) ,包含 在 MIL-STD-105D 中 
的 抽样 计划 利用 随 批量 大 小 IN 变化 的 样本 量 选择 Lus = | d 
计划 中 指定 的 样本 容量 是 为 了 给 出 使 用 方 风险 的 合 
理 值 , 此 外 , 使 得 构造 的 每 个 计划 都 落 在 三 种 水 平 检 
在 方 案 之 一 : 放宽 的 ( 工 )、 正 常 的 ( 卫 ) 、 加 严 的 ( IH). 较 低 的 使 用 方 风险 关联 着 加 严 的 计划 
MIL-STD-105D 中 的 两 个 表 见 表 B. 22 和 表 B. 23， 以 下 例子 解释 它们 的 使 用 
例 16. 12 对 于 批量 大 小 为 500, 可 接受 质量 水 平 为 0. 065 , 求 合适 的 MIL-STD-105D 正常 (水 平 ) 的 
一 般 检 查 抽样 计划 . 
ME 选择 抽样 计划 的 第 一 步 是 指出 相应 于 批量 大 小 为 500 及 正常 检查 水 平 ， 即 水 平 卫 下 的 MIL 
STD-105D 代码 , 字 码 H 是 在 表 B. 22 相应 于 批量 281-500 的 行 与 标 有 下 的 列 中 找到 的 
选择 计划 的 第 二 步 是 由 表 B. 23 确定 样本 容量 和 接受 数 . 样本 量 字 码 在 表 中 第 一 列 , 推荐 的 样本 
REDERI. 在 第 一 列 往 下 移 到 字 码 卫 处 ,可 以 看 到 推荐 的 样本 量 (第 一 列 ) En =. 为 了 求 接收 数 ， 


a =0.086 £ 











用 方 风险 
B =0.376 














图 16.22 n-10, a=1 时 操作 特性 曲线 草图 
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最 上 面 的 行 横 移 到 6. 5% 处 ,或 等 价 地 AQL =0. 065, dil CA.) a =7 出 现在 6.5 JUA H 470022 SA. 同时 
出 现在 这 个 交点 处 的 数 8 是 抽样 计划 的 拒绝 数 ， 即 如 果 y 大 于 等 于 8 就 拒绝 批 
可 以 看 出 这 个 MIL-STD-105D 抽样 计划 利用 了 比例 16. 11 的 计划 大 得 多 的 样本 (n =50). 因为 这 个 
样本 量 较 大 , 所 以 对 给 定 的 批 不 合格 品 率 P, 计算 的 批 接收 概率 P(A4) 将 比例 16. 11 的 计划 小 得 多 , RN 
说 MIL-STD-105D 计划 比例 16. 11 中 的 计划 严 ,使 用 方 风险 较 小 , 或 等 价 地 ,人 允许 更 少 的 不 良 批发 运 . 
MIL-STD-105D 抽样 计划 的 接收 概率 P(4) 可 以 如 本 节 开 始 所 描述 的 那样 计算 . 例如 对 于 例 
16. 12 中 批 不 合格 品 率 p= 0. 10, 有 


P(A) = P(y <7) = LO 
Hoh p(y) & N 2500, n 250 的 超 几 何 概率 分 布 , 批 中 的 不 合格 品 个 数 "是 Np = (500) (0. 1) =50. 
P(A) 的 实际 计算 是 烦 下 的 , 最 好 用 计算 机 来 完成 
应 用 练习 105D 一 般 检 查 抽样 计划 . 


16.44 ”抽样 计划 分 析 . 考虑 样本 量 n=5, 接受 数 a. 放宽 的 ( 工 ) 检 查 水 平 
a =0 的 抽样 计划 . b. 正常 的 (I) 检查 水 平 . 


; e. WER REKE. 
a. 对 不 合格 品 率 p = 0. 1, 0. 3, 0.5 计算 批 接收 概 ; j> 15 ` 
3, 并 画 出 这 个 计划 的 操作 特性 曲线 图 . 16.47 电线 抗 拉 强 度 , 在 某 个 批量 为 400 的 电线 


中 ,规定 抗 拉 强度 大 于 5 kg, 考虑 基于 n = 10 ME 
b. # AQL=0.01, 3 d. 
LO READER 本 及 接收 数 a = 1 的 抽样 验收 计划 . 
16.45 BEIRAS HEIBEER E 15 接受 a. E AQL 为 2.5% ,求生 产 方 风险 . 
MR 5. SERE BER 若 不 能 满足 规定 的 批 不 合格 曲率 请 -0 15, R 


| 使 用 方 风险 . 
对 不 合格 品 率 p 20.1, 0.2, 0.3, 0.4, 0.5, 计算 批 T 
a MAMMA rumim m c。 夯 出 这 个 抽样 计划 的 操作 特性 曲线 草图 ， 这 个 
a 0 05, $KE = MES ° 抽样 计划 可 以 接受 吗 ? 请 解释 
e dp 20.20 ERREUR. 16.48 电线 抗 拉 强 度 ( 续 ). 参考 练习 16.47. 对 于 
16.46 求 抽样 计划 . 对 于 批量 大 小 为 5000, AQL 为 批量 大 小 为 400，AQL 为 2.5%， 求 合适 的 MIL- 
4%， 求 在 下 列 几 种 检查 类 型 中 合适 的 MIL-STD-  STD-109D 正 沉 (水 玉 ) 的 一 般 抽样 检查 计划 . 


“16. 11 其 他 抽样 计划 


在 16. 10 节 中 , 提出 了 一 种 基于 包含 在 单个 样本 中 不 合格 品 个 数 的 抽样 计划 , 第 二 种 类 型 的 抽 
样 验收 计划 是 基于 二 次 或 多 次 抽样 计划 . 二 次 抽样 计划 牵涉 到 从 批 中 选择 m 个 个 体 , 如果 样本 中 不 
合格 品 个 数 y IE y, sas, 则 接收 这 批 ; 如 果 y mr, (eo ri >a), 则 拒绝 批 , 如 图 16. 23 所 示 . 如 
R yi RE a Mr 之 间 , 那么 再 从 批 中 选 出 容量 为 n, 的 第 二 个 样本 , 记录 +n, 个 抽样 个 体 中 的 
不 合格 品 总 数 7 如 果 y 小 于 等 于 第 二 个 接受 数 a, 则 接收 这 批 ; 否则 拒 收 这 批 . 








| | | L | —L. | l ] 
0 1 2 7 a, atl a+ 7 一 n nl 1 
接收 批 抽取 第 二 个 样本 拒绝 批 
不 合格 品 个 数 


图 16.23 ”二 次 抽样 计划 中 第 一 个 样本 的 接收 数 a 和 拒 收 数 rm 的 位 置 
多 次 抽样 最 后 演变 为 序 贯 抽样 . 在 序 贯 抽样 计划 中 ,从 批 中 一 个 一 个 的 选取 个 体 , 每 选取 一 个 
个 体 , 做 出 接收 批 、 拒 收 批 或 从 批 中 抽样 下 一 个 个 体 的 决策 . 在 这 种 抽样 类 型 下 , 可 能 会 早 在 抽样 第 
一 个 、 第 二 个 或 第 三 个 个 体 时 做 出 接收 (或 拒 收 ) 批 的 决定 ， 也 可 能 需要 一 个 很 大 的 样本 才能 决定 接 
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收 或 拒 收 批 , 所 以 在 序 贯 抽样 中 , 样本 量 ”是 一 个 随机 变量 . 

除了 基于 观测 的 不 合格 品 个 数 y 的 一 次 、 多 次 和 序 贯 抽样 , 还 提出 了 用 于 定量 变量 测量 值 的 相 
似 计划 . 例如 , 不 是 检查 样本 中 的 每 个 个 体 , 并 将 它 分 为 不 合格 品 和 合格 品 ， 现在 是 基于 每 个 个 体 的 
定量 测量 值 做 出 拒 收 或 接收 批 的 决定 . 例如 , 50 加 仑 一 桶 的 丙酮 购买 者 可 能 主要 关心 每 桶 的 容量 至 
4» 50 WME. 一 个 典型 的 抽样 计划 可 能 是 从 每 批 抽样 10 桶 ,测量 每 桶 的 精确 加 仑 数 y. 可 以 把 容量 在 
50 加 仑 以 下 的 桶 看 作 不 合格 品 ,并 根据 样本 中 不 合格 品 桶 个 数 做 出 拒 收 或 接收 批 的 决定 . 男 一 种 方法 ， 
也 可 以 根据 样本 均值 7, 即 10 桶 丙酮 的 平均 量 做 出 决定 . 基于 定量 测量 值 的 样本 均值 的 抽样 计划 叫做 计 
量 抽样 验收 . 最 广泛 使 用 的 这 种 抽样 计划 是 军事 标准 414 ( MIL-STD-414). 

有 关 抽 样 验收 计划 的 文献 非常 多 , 关于 抽样 计划 和 这 方面 的 更 多 知识 ， 请 参考 本 章 末 的 参考 文 
献 . 然而 在 结束 这 个 讨论 之 前 , 我 们 给 出 一 个 观念 : 抽样 并 不 总 是 值得 的 . 可 能 存在 某 种 情形 , 抽样 
的 成 本 太 昂贵 , 使 得 唯一 的 选择 是 或 者 做 100% 的 检查 或 根本 不 检查 . 所 以 总 花费 在 抽样 验收 计划 选 
择 过 程 中 起 着 重要 的 作用 . 


"16.12 ” 调 优 操作 


调 优 操作 是 通过 从 操作 过 程 中 提取 信息 来 提高 工业 产品 的 产量 和 /或 质量 的 -项 技术 . 为 了 解释 
这 种 方法 , 假定 一 种 化 学 产品 的 某 个 质量 特征 ， 如 粘性 依赖 于 几 个 变量 , 包括 原材料 的 温度 以 及 将 
它们 混合 的 大 桶 中 所 保持 的 压强 . 为 了 研究 这 些 变量 对 于 一 批 产品 粘性 的 影响 , 可 以 在 实验 室 模拟 
这 个 过 程 , 进行 如 第 13 章 所 描述 的 多 变量 试验 (例如 析 因 实 验 )， 但 是 这 个 过 程 是 昂贵 的 , 并 且 模 拟 
可 能 与 生产 过 程 有 不 同 的 运转 情况 . 

第 二 种 且 花 费 较 少 的 方法 是 仅仅 关注 两 三 个 自 变量 ， 并 按照 设计 的 试验 设置 这 些 变量 的 变化 . 
关键 是 对 自 变量 很 小 的 变化 , 使 得 观测 不 到 产品 质量 的 改变 . 为 了 发 现 这 些微 小 改变 的 影响 , — 
一 饥 的 重复 试验 , 直到 样本 量 足够 大 ， 使 得 统计 检验 时 质量 变量 的 均值 微小 改变 是 显著 的 . 

例如 , 假定 知道 许多 可 控 的 过 程 变量 ， 包括 原材料 的 温度 和 压强 ， 它 们 影响 一 桶 生产 的 化 学 品 
的 粘性 . 我 们 担心 在 这 些 变量 上 改变 的 试验 可 能 生产 出 不 良品 并 由 此 带 来 经 济 损失 ， 然而 , 知道 温 
度 和 压强 的 微小 变化 ,( 如 2 下 和 2 lb/in? 的 改变 ) 对 产品 质量 的 影响 可 以 忽略 . 


为 了 研究 温度 和 压强 的 影响 , 将 在 操作 过 程 中 进行 一 项 试验 , 利 温度 
用 如 图 16. 24 所 示 的 试验 设计 . 来 自 设 计 的 4 个 温度 压强 组 合 是 2x2 ° 51 ° 


析 关 试验 的 4 个 因子 水 平 组 合 , 再 加 上 设计 区 域 中 心 的 压强 温度 组 合 
(SOF , 130 Ib/in?) , 使 得 我 们 可 以 发 现在 试验 区 域 的 中 心 有 相 对 高 
《或 低 ) 的 平均 粘性 , 如 果 这 种 情况 存在 . 129 u Ea 
为 了 进行 调 优 操作 , 对 每 桶 化 学 品 安排 5 种 压强 温度 组 合 , 测量 
每 个 组 合 的 粘性 y. 如 果 制造 商 每 天 生产 10 桶 , 我 们 得 到 图 16. 24 设 
TER S 种 处 理 下 的 两 次 重复 . 如 果 基 于 一 天 的 数据 或 甚至 100 天 的 数 e 49 ° 
IB, 进行 统计 检验 来 发 现 平均 粘性 的 变化 , 可 以 想象 平均 粘性 没有 变 图 16.24 调 优 操作 的 试验 设计 
化 是 显然 的 . 然而 , 如 果 在 一 个 很 长 时 间 内 继续 收集 数据 , 每 天 得 到 
试验 的 两 次 重复 , 最 终 会 发 现 平均 粘性 ( 如 果 存 在 的 话 ) 的 变化 . 所 以 ， 调 优 操作 的 逻辑 是 生产 过 程 
生产 一 件 产 品 的 同时 , 它 也 产生 数据 . 为 什么 不 利用 免费 (除了 收集 的 花费 ) 的 信息 呢 ? 
虽然 单个 观测 值 包含 很 少 的 关于 压强 和 温度 对 平均 粘性 影响 的 信息 ， 但 是 巨 量 的 数据 最 终 会 向 
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我 们 说 明 怎 样 改 变 这 些 变量 产生 平均 粘性 的 合理 变化 . 因此 , 随时 间 进 行 的 重复 试验 使 过 程 逐渐 发 
展 成 为 高 水 平 的 质量 和 /或 产量 . 








快速 回顾 
重要 公式 
控制 图 中 心 线 控制 限 ( 下 , E) 
计量 控制 图 rž $25 
k — 
x l EDI y£ A Ra Ü 2 d) 
k = — Vn 
k 
REB _ ÈR (RD, ,RD,) 
Rz 
k 
-— 不 合格 品 总 数 - s BOD 
ds P= 抽样 单位 总 数 PIA 
< 图 c = 每 个 个 体 的 平均 不 合格 品 数 € € 34c 
USL - LSL 规格 差距 * 
6g = 6s 过 程 散布 * 
(USL - LSL)/6o C, 指数 ” 
k t Ks, rB K fk F a, y, n 100y% 测量 值 的 (1 - a)100% 容许 区 间 
Xin s Xmax) 非 参数 容许 区 间 
本 章 总 结 提示 


° 全 面 质量 管理 (TQM ) 一 一 包括 一 项 业务 所 有 阶段 的 质量 管理 . 

。 统计 受 控 的 过 程 具 有 不 随时 间 而 变化 的 输出 分 布 ; 如 果 变 化 , 则 过 程 是 失控 的 . 
统计 过 程控 制 (SPC) 一 一 监测 并 消除 变异 使 得 过 程 保 持 受 控 的 过 程 . 

两 种 变异 的 原因 一 一 可 查 明 原因 和 和 随机 ( 机会) ER. 

规格 限 一 一 对 输出 变量 规定 的 可 接受 值 . 

合理 子 组 使 过 程 的 变化 更 可 能 出 现在 子 组 之 间 ( 而 不 是 之 内 ) 而 设计 的 样本 . 
监测 变量 的 控制 图 一 一 计量 值 (个体 值 ) 控 制图 . 

监测 过 程 均值 的 控制 图 一 一 x* 图 . 

监测 过 程 变异 的 控制 图 一 一 R 图 . 

发 现 趋势 的 控制 图 一 一 游程 图 . 

监测 比率 非 一 致 性 的 控制 图 一 一 p BR. 

监测 每 个 个 体 缺陷 数 的 控制 图 一 一 c 图 . 

仅 在 RR 图 证 实 过 程 变异 是 受 控 后 , 才 解 释 志 图 . 

能 力 分 析 一 一 用 来 确定 过 程 是 否 具有 满足 顾客 的 能 

能 力 指 数 (Cj ) 一 一 概括 与 规格 限 有 关 的 过 程 性 能 . 

质量 保证 抽样 计划 一 一 用 于 防止 来 自 运 送 产 品 的 不 良 批 . 

操作 特性 曲线 一 一 接受 批 的 概率 关于 不 合格 品 率 的 图 . 

调 优 操作 一 一 在 不 断 发 展 的 制造 操作 中 进行 试验 并 提高 质量 . 
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CEE: 标 星 号 ( * ) 的 项 来 自 本 章 选 学 的 节 . ) 





符 读 法 说 ” H 

SPC S-P-C 统计 过 程控 制 

TQM T-Q-M 全 面 质量 管理 

LCL L-C-L 控制 下 限 

UCL U-C-L 控制 上 限 

& x-bar-bar 样本 均值 的 平均 

R R-bar 样本 极 差 的 平均 

A, A-two # B. 19 中 得 到 的 常数 

D, D-three 表 B. 19 中 得 到 的 常数 

D, D-four xx B. 19 中 得 到 的 常数 

d, d-two 表 B. 19 中 得 到 的 常数 

d, d-three X B. 19 中 得 到 的 常数 

P p-hat 估计 的 样本 中 不 合格 曲率 

p p-bar 所 有 琵 个 样本 中 总 的 不 合格 品 率 
c c-bar 所 有 个 时 间 段 内 每 个 个 体 缺陷 数 的 平均 
K 从 表 B. 20 中 得 到 的 常数 

USL * U-S-L 规格 上 限 

LSL* L-S-L 规格 下 限 

C; Cp 能 力 指 数 

y gamma 总 体 中 测量 值 的 比率 


AQL A-Q-L 可 接受 质量 水 平 
.Cm 


补充 应 用 练习 


(注意 ; 带 星 号 ( * ) 的 练习 来 自 本 章 选 学 的 节 . ) 
16.50 ”螺纹 中 径 . 某 家 工厂 有 一 项 工作 是 螺纹 磨 削 
飞机 液压 系统 的 配件 . 为 了 监测 这 个 过 程 , 在 20h 
A, 生产 检查 员 每 小 时 随机 抽取 5 个 配件 , 测量 
螺纹 中 径 . 测量 值 表示 以 0. 0001 in 为 单位 的 超过 
0. 4000 in 的 部 分 ,如 表 中 所 示 . (例如 , 值 36 表 


16.49 电 轴 的 直径 . 假定 制造 电 轴 过 程 是 受 控 的 ， 
dE 20 h 内 的 每 小 时 结束 时 , 制造 商 随机 选取 一 根 
电 轴 并 且 测 量 其 直径 , 20 次 抽样 的 测量 值 (in) 记 


录 在 下 表 中 , 构造 并 解释 电 轴 控制 图 . 


样品 直径 (in) 样品 











RÀ 直径 (in) 
1 1.505 | uu 1.491 
2 1.496 12 1. 486 
3 1.516 13 1.510 
4 1.507 14 1.495 
5 1.502 15 1.504 
6 1. 502 16 1.499 
7 1. 489 17 1.501 
8 1.485 18 1.497 
9 1. 503 19 1. 503 
-10 1.485 20 1.494 


示 0. 4036 im. ) 


a. 


b. 


e 


= 


构造 RR 图 来 监测 中 径 的 变异 ， 过程 受 控 吗 ? 
修正 丸 图 中 控制 限 , 使 得 可 以 用 于 未 来 的 数据 . 
为 过 程 构造 去 图 , 过 程 均值 受 控 吗 ? 

蓟 除 落 在 控制 限 以 外 的 点 , 重新 计算 他 们 的 值 ， 
对 将 来 数据 ,推荐 使 用 这 些 修正 的 控制 限 吗 ? 





小 时 螺纹 中 径 
1 36 35 34 33 32 
2 31 31 34 32 30 














16.51 
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(2) 8 h 内 每 小 时 从 生产 线 上 抽取 4 4, WERNA 
Fen "TIT. TÁRRUTEAMICAHRE, 结果 如 下 表 . 
3 30 30 32 30 32 pen Pa 
4 32 33 33 32 35 1 13.1 12.8 12.7 12.9 
5 32 34 37 37 35 2 12.5 13.0 13.6 13.1 
6 32 32 31 33 33 3 12.9 12.9 13.2 13.3 
7 33 33 36 32 31 4 12.4 13.0 12.1 12.6 
8 2 33 36 35 36 5 12.8 11.9 12.7 12.4 
? 4 36 35 24 31 6 13.0 13.6 13.2 12.9 
10 36 35 36 4l 4l 7 13.5 13.5 13.1 12.7 
N M 38 35 34 38 8 12.6 13.9 13.3 12.8 
12 36 38 39 39 — 40 
3 3 4 3 2% 3 a. RER ERA REFERT. 
14 Ë 3 3 3 3 b， 利 用 表 B. 19, 建立 均值 控制 限 . 
5 ° 8 3 3 3s e. 利用 全 样本 的 标准 差 , 建立 均值 控制 限 , 并 与 b 
16 28 31 33 33 33 的 控制 限 比较 
6 Z on on 2 Àx a 所 有 观测 的 样本 均值 都 落 在 控制 限 内 吗 ? 由 此 
19 35 36 29 27 32 说 明 了 什么 ? I 
2 3 5 3 5 x» e. OR 99% OR rh REN 99% 容许 区 间 ， 假 定 





资料 来 源 : Grant, E. L. , and Leavenworth, R. S. Statistical 
Quality Control, 5th ed. New York: McGraw-Hill, 1980 ( 3& 
1-1), Reprinted with permission. 

HE. 参考 练习 16.3 中 瓶 的 制造 过 程 . 为 了 
监测 过 程 均 值 , 在 20 个 时 间 点 (天 ) 从 生产 过 程 中 
抽取 3 个 制 成 的 瓶 ， 上 个 月 的 检查 数据 (重量 ,次 
司 ) 列 在 表 中 . 为 制 成 的 瓶子 重量 构造 尺 图 和 A, 
并 解释 结果 . 








天 瓶 重 天 ME 

1 5.6 5.8 58 11 62 5.6 5.8 
2 5.7 63 6.0 12 59 5.7 5.9 
3 61 5.3 6.0 13 5.2 5.5 5.7 
4 63 5.8 5.9 14 60 6.1 6.0 
5 5.2 59 6.3 1 63 5.7 5.9 
6 60 67 5.2 l6 58 6.2 6.1 
7 5.8 5.7 61 17 6.1 6.4 6.6 
8 5.8 6.0 6.2 18 62 5.7 5.7 
9 64 5.6 5.9 19 53 55 5.4 
10 60 5.7 6.1 20 60 61 6.0 





16.52 B Piik. HU EOR b IS AIR EE EF 8] 
中 镍 含量 是 重量 的 1395. 为 了 监测 生产 过 程 , 在 


镍 含量 的 分 布 是 近似 正 态 的 . 
f 为 液压 阀 中 镍 含量 的 变异 性 构造 带 控制 限 的 控 
制图 , 并 解释 结果 . 


“16. 53 ”抽样 计划 分 析 . 质量 控制 检查 员 正 在 研究 


两 种 抽样 计划 (n=5, a=1) 和 (n=25, a=5). 

a. 利用 批 不 合格 品 率 0.05, 0.10, 0.20, 0.30, 
0. 40, 画 出 两 种 计划 的 操作 特性 曲线 的 草图 . 

b. 作为 一 个 AQL = 0. 10 生产 批 的 销售 商 , 认为 两 
个 抽样 计划 哪个 更 好 ? 为 什么 ? 

c， 作 为 一 个 购买 者 , 拒绝 接受 不 合格 品 率 超过 p = 
0.30 的 批 , 两 个 抽样 计划 中 的 哪个 更 好 ? 为 
什么 ? 


16.54 监测 辊 轧钢 . 一 家 公司 为 核潜艇 制造 辊 轧 


钢 . 为 了 监测 生产 过 程 , 在 连续 12 个 小 时 内 , 质量 
检查 员 每 小 时 从 生产 线 上 抽样 已 完成 的 辊 轧钢 . 在 
FERH LERURE RE F R. 


小 时 1 2 3 4 5 
XXE 4 10 8 


6 7 8 
7 11 12 6 15 13 


9 10 1]! 12 
4 9 10 


a HRILA = S IO EUROS S Es a E. 
b. 在 控制 图 中 确定 中 心 线 和 控制 上 下 限 的 位 置 . 
c. 制造 过 程 受 控 吗 ? 
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16.55 电子 管 抽样 . 对 于 一 批 可 接受 质量 水 平 为 
10% 的 250 个 电子 管 , 在 以 下 每 种 检查 方案 中 求 合 
适 的 MIL-STD-105D 一 般 检 查 抽样 计划 . 

a 正常 检查 水 平 . 

b. 加 严 检查 水 平 . 

16.56 不 合格 的 机 器 人 . 高 水 平 计算 机 技术 研发 了 
用 于 操作 工业 “机 器 人 ”的 小 型 微 处理 器 . 为 了 监 
测 由 某 个 制造 过 程 生产 的 微 处 理 器 不 合格 品 率 ， 
每 小 时 抽样 50 个 微 处 理 器 , 20 个 小 时 的 抽样 结果 
在 下 表 中 给 出 . 


—————————————— 
样本 1 2 3 4 5 6 7 8 9 10 


不 合格 品 数 5 6 4 7 1 3 6 S 4 5 
样本 ll 12 13 14 15 16 17 18 19 20 

不 合格 品 数 8 3 2 1 0 1 1 2 3 3 

— —  — A - 








a. 构造 微 处 理 器 的 不 合格 品 率 控制 图 . 
b. 在 控制 图 中 确定 中 心 线 和 控制 上 下 限 的 位 置 . 
过 程 受 控 吗 ? 

c. 对 控制 图 进行 游程 分 析 , 并 解释 结果 . 

16.57 WARE. 建筑 工程 师 买 了 大 卷 的 钢 缆 , 在 

安装 永久 性 结构 过 程 中 用 于 支承 设备 和 临时 搭建 

物 , 规格 要 求 钢 缆 的 抗 断 强度 超过 200 lb. 对 于 批 

量 为 1 500 的 大 卷 钢 缆 ,考虑 一 个 基于 样本 量 n = 

20, 接收 数 a =2 的 抽样 验收 计划 . 

WR AQL Jy 0.05, 求生 产 方 风险 . 

b， 如 果 不 能 满足 抗 断 强 度 规格 的 批 不 合格 品 率 是 
p, =0. 10, 求 使 用 方 风险 . 

e. 为 这 个 抽样 计划 画 出 操作 特性 曲线 草图 . 抽样 
计划 合理 吗 ? 

.对 于 批量 大 小 为 1 500 的 大 卷 钢 缆 以 及 0.05 的 
. AQL, 求 合适 的 MIL-STD-105D 正常 (水 平 ) 一 般 
检查 抽样 计划 . 

e. 参考 d, 在 这 个 抽样 检查 计划 下 求生 产 方 风险 . 
(ER: 用 正 态 近似 二 项 . ) 

. 参考 d, 如 果 不 能 满足 抗 断 强度 规格 的 批 不 合格 
品 率 是 p, =0.08, 求 使 用 方 风险 . (提示 : 用 正 
态 近 似 二 项 . ) 

16.58 环 氧 化 物 修 补 连 接 . 参考 练习 7. 41 中 描述 的 

环 氧化 物 修补 捆扎 连接 的 压力 分 析 . 对 于 木 制 的 环 

氧 树脂 黏合 的 捆扎 连接 进行 试验 , 确定 实际 的 胶 

水 黏合 切断 应 力 的 容许 量 ( Journal of Structural En- 

gineering , 1986 4E 2 月 ). 100 个 南方 松 捆扎 连接 的 


pP 


a 


= 


随机 样本 的 切断 强度 (lbyin ) 的 均值 和 标准 差 是 : 
X -1.312 s=422 
a. 假定 强度 测量 值 的 分 布 是 近似 正 态 的 , 构造 
99% 的 切断 强度 的 95% 容许 区 间 . 
b. 解释 a 中 得 到 的 区 间 ， 
c， 当 正 态 性 假定 不 满足 时 , 可 以 怎样 得 到 容许 区 间 . 


16.59 有 缺陷 的 塑料 模具 . 一 家 制造 塑料 模具 零件 的 


公司 认为 正在 生产 不 正常 多 的 不 合格 品 . 为 了 证 实 这 

种 怀疑 , 每 个 轮班 随机 抽取 7 个 200 个 零件 的 样本 ， 

用 目测 每 个 零件 确定 它 是 否 为 不 合格 品 , 记录 出 现 的 

主要 缺陷 类 型 (Hart, 1992) , 数据 如 下 表 . 

a 为 这 个 制造 过 程 构造 p Eg. 

b. 控制 限 能 用 于 监测 未 来 过 程 的 输出 吗 ? 请 解释 . 
缺陷 类 型 


样本 轮班 缺陷 数 
CHE KAR pus BN 气泡 整洁 








O O — CN tA + Q N — 
= @ 00 = N O t Q 局 一 


_ 
eo 
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= — 
No — 
Q Q Q GOO U QQ OQ N sN POM MOD No o n — = — 一 
v t 
° o 
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16.60 *#3& d 65 4 AF01]. Mountain 航空 公司 的 官 


员 们 对 乘客 在 内 华 达 州 里 诺 的 机 场 业务 台 排队 等 待 
检票 的 时 间 长 度 感 兴趣 . 为 了 得 到 控制 图 , 在 20 天 
内 每 天 抽取 5 个 顾客 , 以 分 钟 计 的 数据 如 下 表 所 示 . 





样本 等 待 时 间 ( min) 
1 3.2 6.7 1.3 8.4 2.2 
2 5.0 4.1 7.9 8.1 0.4 
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( 续 ) 确定 的 规格 上 限 是 5 min. 

样本 等 待 时 间 (min) b. 过 程 有 能 力 吗 ? 验证 你 的 答案 . 

3 L1 32 21 65 37 c 如果 估计 和 解释 这 个 过 程 的 C, 是 合适 的 ,做 这 
4 4.2 1.6 2.7 7.2 1.4 些 工作 . 如 果 不 合适 ， 解释 原因 . 

; " i » i io d. 管理 层 为 什么 不 提供 规格 下 限 呢 ? 

; 6 2 2 0 1 2 0.9 14 16.62 碳 素 杆 的 缺陷 . 高 尔 夫 球 棒 的 制造 商 收 到 了 

8 L4 27 38 46 38 大 量 关于 碳 素 杆 性 能 的 投诉 ,监测 一 种 用 拉 挤 成 

9 1.1 4.3 9.1 3.1 2.7 型 方法 生产 碳 素 杆 的 过 程 ， 拉 着 织物 通过 热 固 聚 
10 53 41 98 29 27 合 物 溶液 , 然后 再 通过 又 长 又 热 的 钢 模 ， 随 着 它 在 
11 3⁄2 29 41 56 08 模具 中 的 移动 , 杆 就 做 好 了 ,最 后 , 把 它 剪 成 所 需 
12 24 43 67 L9 48 的 长 度 . 在 这 个 过 程 中 可 能 出 现 的 缺陷 是 内 部 空 
5 $8 53 66 10 45 BR. DERE, E BE E e UE Ili A KM T JE n 
4 37 $6 20 27 59 微小 裂纹 . 质量 部 门 每 30 min 连续 抽取 10 个 杆 ， 
ro " » » w EG IEBERRPE TURO R UT EE. 每 8 h 轮班 工 
17 55 7 1 21 0.9 28 作 的 数据 合成 160 个 杆 的 轮班 样本 ，36 TP SEBERE 
is Ls 56 22 17 21 本 的 不 合格 率 数 据 如 下 表 所 示 , EK RER 
19 26 37 48 14 s3 数据 也 在 下 表 中 给 出 . CO: 每 个 不 合格 杆 可 以 有 
20 3.6 0.8 5.1 4.7 6.3 £ jr. ) 





a 由 这 些 数据 构造 R KI. 


b. 关于 坟 程 的 稳定 性 尺 图 提示 了 什么 ? 请 解释 . 
c. 说 明 为 什么 在 z 图 之 前 应 该 先 解释 图 . 


d 由 这 些 数据 构造 去 图 . 


e 关于 过 程 的 稳定 性 x 图 提示 了 什么 ? 请 解释 . 


a. 利用 合适 的 控制 图 确定 随 着 时 间 的 改变 过 程 比 


率 是 否 稳定 . 


b. 为 了 诊断 过 程 输出 的 变异 原因 ,为 观测 到 的 杆 
缺陷 类 型 构造 帕 雷 托 图 ， 哪 一 种 是 “关键 的 少 


数 ”, 哪 一 种 是 “次 要 的 多 数 ”? 














i h | N 缺陷 类 型 TE 
f£ REM x 图 的 控制 限 能 用 于 监测 未 来 的 过 程 输 mom - 
出 吗 ? 请 解释 . T o 
16.61 飞机 来 客 的 等 待 时 间 . 考虑 练习 16.60 中 描 Bilik ri » 
述 的 飞机 检票 过 程 . ; 
a 假定 过 程 受 控 , 构造 过 程 的 能 力 分 析 图 , 管理 层 — sm 10 — 
轮 班 号 不 合格 杆 数 不 合格 率 轮 班 号 不 合格 杆 数 不 合格 率 
1 9 0.05625 12 7 0.04375 
2 6 0.03750 13 9 0.05625 
3 8 0. 05000 14 14 0.08750 
4 14 0. 08750 15 7 0. 04375 
5 7 0.04375 16 8 0. 05000 
^6 5 0. 03125 17 4 0. 02500 
7 7 0. 04375 18 10 0. 06250 
8 9 0. 05625 19 6 0. 03750 
9 5 0. 03125 20 12 0. 07500 
10 9 0. 05625 21 8 0. 05000 
11 1 0. 00625 22 5 0. 03125 
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(E) 

轮 班 号 不 合格 杆 数 不 合格 率 轮 班 号 不 合格 杆 数 不 合格 率 

23 9 0. 05625 30 6 0. 03750 

24 15 0. 09375 31 9 0. 05625 

25 6 0.03750 32 11 0.06875 

26 8 0. 05000 33 8 0. 05000 

27 4 0. 02500 34 9 0. 05625 

28 7 0. 04375 35 7 0. 04375 

29 2 0. 01250 36 8 0. 05000 








资料 来 源 : Kolarik, W. Creating Quality: Concepts, System , Strategies, and Tools. New York; McGraw-Hill, 1995. 


活动 中 的 统计 学 :喷气 式 飞 机 燃料 添加 剂 安 全 性 测试 

美国 材料 实验 协会 (ASTM ) 为 材料 、 产 品 、 系 统 和 服务 提供 国际 标准 和 指导 . 对 ASTM 方法 中 清 
楚 说 明 喷气 式 飞机 燃料 安全 性 ， 联邦 航空 局 (FAA) 有 许多 测试 要 求 . 本 章 活 动 中 的 统计 学 与 提出 检 
测 喷气 式 飞 机 燃料 中 表面 活性 剂 新 方法 的 工程 公司 有 关 . 

表面 活性 剂 基本 上 是 一 种 脂肪 酸 盐 , 它 可 能 是 由 燃料 中 的 酸 ， 但 更 普遍 的 原因 是 因为 其 他 产品 ， 
如 发 动机 清洁 附加 剂 的 污染 而 形成 . 虽然 表面 活性 剂 不 会 直接 引起 问题 ， 但 是 他 们 降低 凝聚 式 过 滤 
器 脱水 能 力 . 喷气 式 飞 机 燃料 中 的 水 带 有 细菌 ， 它们 沉积 于 容器 和 发 动机 部 件 , 引起 严重 腐蚀 ， 导 臻 
发 动机 损坏 . | 

表面 活性 剂 的 标准 检验 (在 ASTM 规则 D-3948 中 描述 ) ERREKIE A) 的 微型 过 滤器 (过 
滤器 A), 抽出 的 水 /燃料 混合 物 以 指定 的 速度 经 由 过 滤器 ， 由 光 透 射 率 试验 发 现 透 过 过 滤器 的 水 量 ， 
试验 的 测量 值 一 般 介 于 80 ~90. 

在 一 次 提高 表面 活性 剂 检验 精度 的 尝试 中 , 工程 公司 比较 了 标准 检验 ( 泵 A 与 过 滤器 A) 和 三 种 
其 他 抽水 机 和 泵 的 选择 组 合 , 即 泵 A 与 过 滤器 B、 泵 B 与 过 滤器 A MEB 与 过 滤器 B. 每 天 在 一 批 党 
规 喷 气 式 飞 机 燃料 中 添加 0. 4ppm 的 表面 活性 剂 溶液 . 随机 选择 燃料 的 12 个 样本 , 再 随机 分 为 4 组 ， 
每 组 三 个 样本 , 一 个 组 内 的 三 个 样本 用 4 种 泵 /过 滤器 组 合 之 一 检验 表面 活性 剂 . 因此 , 对 于 每 种 泵 / 
过 滤器 方法 每 天 有 三 个 检验 结果 , 这 种 抽样 模式 持续 100 R, 检验 测量 值 保存 在 4 个 正 TFUEL 文件 
里 .〈 抽 样 试验 前 5 天 的 数据 列 在 表 SIA16. 1 rh. ) 


样本 均值 旁边 . 

可 以 看 到 只 有 一 个 过 程 均 值 是 “ 受 控 ” 的 一 S B 与 过 滤器 检验 方法 的 均值 , 如 图 SIA16. 1d 
Bim, 而 对 于 其 他 三 个 x 图 中 的 每 个 , 至 少 有 一 种 模式 分 析 规 则 是 违反 的 . 同时 , RB 与 过 滤器 B 的 
每 个 均值 样本 落 在 规格 限 内 (80% ~90% ). 相反 , 其 他 喷射 方法 中 有 几 个 均值 落 在 过 程 的 规格 限 外 . 在 
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表 SIA16. 1 从 JETFUEL 文件 中 选 出 的 数据 








星 期 月 H 样 本 和 泵 B 过 滤器 A 泵 A 过 滤器 A 和 泵 B 过 滤器 B FARB 
星期 二 5 9 1 76 84 85 85 
2 8 ` 91 84 84 
3 81 86 84 88 
星期 三 5 10 1 84 92 87 92 
2 81 93 82 95 
3 86 94 85 90 
星期 四 5 11 1 83 94 82 90 
2 82 96 85 87 
3 79 92 84 81 
星期 五 5 12 1 81 96 81 90 
2 84 91 82 91 
3 83 96 88 92 
星期 一 5 15 1 80 90 87 94 
2 88 92 85 94 
3 87 91 86 84 


三 个 非 标准 表面 活性 剂 检 验方 法 中 , R B 与 过 滤器 B 方法 似乎 是 最 有 前 途 的 . 然而 , 正如 本 章 所 讨 
论 的 , 在 解释 图 之 前 , 首先 应 该 检查 过 程 的 变异 . 

图 SIA16. 2 是 利用 泵 B 与 过 滤器 B 检验 结果 的 MINITAB R 图 . 作为 一 个 选项 , 命令 MINITAB 着 
重 显示 (红色 ) 符 合 表 SIA16. 2 中 给 出 的 前 4 种 模式 分 析 规则 之 一 的 任意 的 样本 极 差 . ( 如 果 违 反 一 
种 规则 , 在 图 中 将 这 种 规则 的 编号 显示 在 样本 极 差 旁边 . ) 图 SIA16. 2 说 明 过 程 的 变异 是 “ 受 控 ” 的 ， 
不 符合 任何 一 种 极 差 模式 分 析 规 则 . 现在 已 经 确认 了 过 程 方差 的 稳定 性 , 图 SIA16. 1d 中 的 # 图 可 以 


Xbar Chart of Pump-A with Filter-A 





- |UCL=91.6002 


Sample Mean 


~ |LCL=81.6250 











Sample 
a) # A 与 过 滤器 A( 标 准 ) 方 法 的 x 图 
图 SIA16.1 x E 
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和 质量 控制 
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Sample 
b) R A 与 过 滤器 B 方法 的 x 图 
Xbar Chart of Pump-B with Filter-A 
8754 - UCL=87.9457 
85.04 | i 
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9 J X=82.6863 
& 825 
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8 800 
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Sample 
c) RB 与 过 滤器 A 方 法 的 元 图 
Xbar Chart of Pump-B with Filter-B 
884 
UCL=87.6156 
= 
© 
o 
2 = 
2 X=84.4655 
= 
E 
图 
k 
LCL=81.3154 
T T T —1T— —— 
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d) R B 与 过 滤器 B 方法 的 过 图 
图 SIA16.1 ( 续 ) 
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表 SIA16.2 ”发 现 控制 图 中 特殊 变异 原因 的 模式 分 析 规 则 
规则 1; 至 少 一 个 点 落 在 3 个 标准 差 控 制 限 之 外 
规则 2; 连续 9 个 或 更 多 的 点 落 在 中 心 线 的 同一 侧 
33: 6 个 或 更 多 的 点 稳定 地 增长 (或 减少 ) 
规则 4， 连续 14 个 或 更 多 的 点 上 下 交替 
规则 5: 连续 3 个 点 中 的 两 个 点 落 在 中 心 线 上 (或 下 ) 的 2 倍 标准 差 控制 限 外 
规则 6: 连续 5 个 点 中 的 4 个 点 落 在 中 心 线 上 (或 下 ) 的 1 售 标 准 差 控制 限 外 


注意 : 规则 1 ~6 用 于 z 图 , 规则 1~4 用 于 尺 图 . 
有 一 个 意义 深刻 的 解释 . x 图 和 及 图 一 起 帮助 工程 公司 确认 , AB 与 过 滤器 B 的 表面 活性 剂 检 验方 
法 ,作为 标准 检验 的 另 一 种 可 行 的 方法 ,似乎 不 存在 特殊 的 变异 原因 ， 比 标准 方法 更 精确 . 

CE: 由 海军 进行 的 广泛 试验 说 明 “ 新 "表面 活性 剂 检 验 提高 的 精度 是 有 效 的 , 然而 新 的 检验 不 
能 检测 到 菜 些 少量 , 仍然 可 以 引起 喷气 式 飞 机 发 动机 出 现 问题 表面 活性 剂 ， 喷气 式 飞 机 燃料 添加 剂 
中 表面 活性 剂 的 原始 检验 仍 是 工业 标准 . ) 


R Chart of Pump-B with Filter-B 
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图 SIA16.2 # B 与 过 滤器 B 方 法 的 图 


eB 17 € 产品 和 系统 的 可 靠 性 


目标 “为 估计 工业 产品 或 系统 在 指定 时 间 内 满意 地 运行 的 概率 提供 某 些 统计 方法 . 
17.1 引言 


你 的 立体 音响 系统 和 你 的 汽车 在 一 段 合理 长 的 时 期 内 能 正常 运行 吗 ? 如 果 能 够 , 我 们 说 这 些 产 
品 是 可 靠 的 . 产品 的 可 靠 性 是 产品 在 一 段 给 定 的 时 期 内 满足 某 些 规定 功能 的 概率 . 例如 , 假定 我 们 想 
要 一 辆 新 汽 在 两 年 的 时 间 内 或 20 000 mile 内 无 故障 运行 , 汽车 满足 这 些 规定 功能 的 概率 是 汽车 的 
可 靠 性 . 

定义 17.1 产品 的 可 靠 性 是 产品 在 一 段 给 定时 期 内 满足 各 种 规定 功能 的 概率 . 

有 些 产 品 需要 一 次 性 功能 , 而 有 些 产品 需要 一 次 又 一 次 的 重复 某 种 功能 直到 最 终 失 效 . 例如 ， 
当 电 流 超 负荷 时 , 保险 丝 或 者 工作 或 者 不 工作 , 保险 丝 的 可 靠 性 是 当 它 遭受 某 种 超 负 荷 电流 时 正常 
工作 的 概率 . 相反 , 汽车 需要 一 次 又 一 次 的 行驶 , 它 的 可 靠 性 是 汽车 在 一 段 指定 的 时 期 内 没有 严重 
故障 而 正常 行驶 的 概率 . 


17.2 失效 时 间 分 布 


产品 的 寿命 长 度 是 直到 产品 不 能 完成 规定 功能 的 时 间 长 度 . 当 产 品 不 能 完成 规定 功能 时 , 就 说 
它 失 效 了 . 

单 件 产品 失效 的 时 间 叫 做 它 的 失效 时 间 . 例如 , 研磨 砂轮 的 寿命 长 度 是 直到 砂轮 不 能 完成 规定 
功能 的 时 间 长 度 . 规定 的 功能 可 能 由 制造 商 制定 , 也 可 能 由 用 户 写 下 他 (或 她 ) 自己 的 规定 , 直到 失 
效 的 时 间 长 度 叫 做 砂轮 的 失效 时 间 

定义 17.2 产品 的 失效 时 间 了 是 一 个 表示 
产品 完成 规定 功能 时 间 长 度 的 随机 变量 ， 

事实 上 , 任何 产品 的 失效 时 间 了 是 逐个 不 
同 的 , 它 是 一 个 随机 变量 . 产品 失效 时 间 的 密度 
函数 叫做 失效 时 间 分 布 , 一 个 典型 的 失效 时 间 
分 布 可 能 如 图 17. 1 所 示 . 

定义 17.3 产品 的 失效 时 间 分 布 是 失效 时 
Mp TU EEG). k L. 5 

如 果 用 符号 f( t) 表示 失效 时 间 的 密度 函 
数 , 那么 产品 在 时 间 to 之 前 失效 的 概率 是 : 图 17. 1 失效 时 间 分 布 


P(T < t) = Flt) = foa 


这 个 概率 是 图 17. 1 所 示 密 度 函 数 下 方 的 阴影 区 域 面积 . 
假定 产品 直到 to 时 仍 生 存 ( 正 常 工作 ) , 我 们 就 说 它 是 可 靠 的 . 那么 产品 的 可 靠 性 , 即 直 到 时 刻 
io 生存 的 概率 是 : 


fo) 
À 











R(t10) =1 - F(t) 
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概率 RCo) ER 17. 1 密度 函数 下 方 1o 右 侧 的 非 阴影 区 域 面积 , 可 靠 性 R (+, ) 也 称 为 产品 的 生存 
函数 . 

实际 上 , 例如 对 在 某 给 定 的 星期 、 月 或 年 里 制造 的 一 些 产品 有 特殊 的 兴趣 , 失效 时 间 分 布 是 这 
组 产品 寿命 长 度 的 (概念 上 ) 相 对 频率 分 布 . 基于 样本 数据 的 分 析 , 可 以 从 第 5 章 所 述 的 密度 函数 中 
选 出 一 个 作为 这 个 分 布 模型 . 为 了 这 个 目的 ,常常 用 威 布 尔 分 布 (在 5. 8 节 讨 论 ) 表示 密度 函数 族 . 

定义 17.4 产品 的 可 靠 性 (或 生存 函数 )R(t，) 是 直到 时 刻 to 产品 生存 的 概率 : 

R(io) 21 - F(19) 

AP FC) JA ataq T 69 XE o m 3k. 


17.9 危险 率 


产品 的 失效 时 间 分 布 使 我 们 能 够 计算 产品 在 时 刻 to 之 前 失效 的 概率 F(to) 和 产品 直到 时 刻 to 仍 生 存 
的 概率 RCo) =1 — F(19). 对 于 失效 时 间 的 一 个 很 小 的 改变 , 用 As 来 表示 , 产品 在 区 间 (1, 1 + Ar) 内 失效 的 
概率 如 图 17. 2 中 阴影 区 域 的 面积 BESO), 即 阴影 甜 形 的 高 , 是 和 这 个 概率 成 比例 的 
描述 产品 寿命 特征 的 另 一 种 方法 是 将 产品 的 失效 概率 作为 产品 年 老 的 度量 , 即 已 知 产品 在 时 刻 
i 生存 , 产品 将 在 区 间 (1, t+ At) 失效 的 概率 . 
如 果 我 们 定义 事件 
A: 产品 在 区 间 (t, t+ At) 失 效 . 
B: 产品 直到 时 刻 ;生存 
那么 已 知 产品 已 经 生存 到 时 刻 i, 它 在 时 i 
li] DX [B] (2, t+ dt) 失效 的 概率 是 ; 
P(AnB 
P(AIB) VOD 
但 是 , 事件 4m8 等 价 于 事件 4, 即 为 了 能 O 
ERKE, t+ Ar) 失效 ,产品 必须 生存 到 
时 刻 i. 因此 ， 











t t + Àt 
P(AnB) =P(A) 图 17. 2 表示 区 间 (4, r+ AO 内 失效 的 近似 
这 个 概率 近似 等 于 图 17. 2 中 的 阴影 部 分 概率 的 失效 时 间 分 布 


的 面积 . 已 知 产品 已 经 生存 到 时 刻 1, 在 区 间 (1, :+ At) 失 效 的 概率 是 : 


_P(ANMB) fl(i) A: FD At 
P(AIB) = P(B) 1-F(:) ~ RG) 





量 
LIO). 
G) RG) 
和 这 个 条 件 概率 成 比例 , 称 它 为 产品 的 危险 率 , 有 关 产品 危险 率 的 知识 常常 帮助 我 们 选择 合适 的 产 
品 失效 时 间 密 度 函数 . 下 面 的 例子 说 明 这 一 点 . 
定义 17. 5 产品 的 危险 率 定义 为 ， 


J dao f £, 65 T EE 695 





x) 2 IUD (D 
1-F(t) R(t) 


其 中 f(t) 是 产品 失效 时 间 分 布 的 密度 函数 . 
CHAI 指数 分 布 (5. 7 节 中 讨论 ) 在 工业 中 经 常用 作 产 品 失效 时 间 的 分 布 模型 . 求 指数 分 布 的 危 
险 率 . 

解 ” 指 数 分 布 的 密度 函数 和 累积 分 布 函数 分 别 是 ， 








e "B 
Ja) = 8 Oxt«o, B>0 
和 
t t eT /B 
FQ) = [ f00dy = | y = 1 -ee 
那么 指数 分 布 的 危险 率 是 : 
e 
z(t) = JG) B 1 





1-FG) 1-(l-e 8) B 


因为 B= E(t) 是 产品 的 平均 寿命 ， 所 以 危险 率 是 常数 ( 见 图 17. 3). 因此 具有 指数 失效 时 间 分 布 
的 产品 不 会 疲劳 , 产品 在 任何 一 个 时 间 单 位 内 生存 的 可 能 性 都 相同 . 

显然 , 指数 分 布 不 是 人 类 或 者 随 着 年 老 而 o 
变 得 疲劳 且 易 于 失效 的 工业 产品 失效 时 间 分 布 
的 好 模型 . 但 是 它 可 以 为 一 些 产 品 , 尤其 是 当 
部 件 失 效 被 替换 的 复杂 系统 提供 了 一 个 好 模 
型 , 这 样 的 系统 运行 了 一 段 时 间 后 , 在 任何 一 
个 时 间 单位 内 的 失效 概率 都 与 其 他 任何 别 的 时 
间 单位 内 的 失效 概率 相同 . 具有 这 种 性 质 ( 也 
就 是 常数 危险 率 ) 的 失效 时 间 分 布 叫做 无 记忆 
分 布 . t 

威 布尔 分 布 (5. 8 节 中 讨论 ) 的 密度 函数 和 累 9 
积分 布 函数 分 别 是 : 图 17. 3 指数 失效 时 间 分 布 的 危险 率 


w= 


fü) = genie Oxt«o; a>0; 6>0 
和 
F(t) -1-e-'"78 


改变 形状 参数 a 和 尺度 参数 B, 可 以 得 到 各 种 各 样 的 密度 函数 ， 对 许多 工业 产品 失效 时 间 分 布 的 模 
型 是 有 用 的 . 当 a =1 时 , 我 们 得 到 指数 分 布 . 
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求 威 布尔 分 布 的 危险 率 , 并 且 对 a =1, 2, 3 画 出 z(1) 关 于 时 间 的 图 像 


fi ”利用 上 面 给 出 的 密度 函数 和 累积 分 布 函 
数 , 得 到 威 布尔 分 布 的 危险 率 是 : 
(号 je -i*/g 


_ 0. ls E" 
AD SILFO 1- (122782) B 


当 形 状 参数 a 等 于 1 时 , 得 


"T 





此 即 指数 分 布 的 常数 危险 率 . 04 a =2 时 ， 
z(t) - 2, 
B 
即 过 原点 的 直线 方程 . 当 @ 23 时 ， 
z(t) - Ë 


时 间 :的 二 次 函数 . 这 些 危险 率 的 图 形 如 图 17. 4 
所 示 . 注意 对 于 较 大 的 形状 参数 a 值 , ERRER 
速 地 增长 . 


应 用 练习 
17.1 预防 维护 试验 . 在 Reliability Engineering and 
System Safety (2006 年 1 月) 提出 了 = 个 独立 运行 零 
件 中 的 某 些 (但 不 是 所 有 ) 预防 维护 试验 的 最 优 计 
划 . 零件 每 小 时 失效 次 数 近似 服从 均值 为 A 的 泊 松 
分 布 , 因此 零件 失效 的 时 间 间 隔 服 从 B=1/A 的 指 
数 分 布 . 求 零 件 失 效 时 间 间 隔 的 危险 率 并 画图 . 
17.2 张力 腿 平 台 的 可 靠 性 . 张力 腿 平台 (TILP) 用 于 
深海 条 件 下 石油 和 天 然 气 的 探测 , 在 Reliability En- 
gineering and System Safety (2006 年 工 月 ) Wf T zh 
击 载荷 下 TLP 可 靠 性 . 研究 者 调查 在 一 台 TLP 动力 
载荷 下 对 冲击 力 有 贡献 的 几 个 随机 变量 . 假定 其 中 
一 个 随机 变量 表示 直到 失效 时 的 潮涌 压力 (单位 为 
MPa) ， 服 从 区 间 (4, 5) 上 的 均匀 分 布 . 求 这 个 随机 
变量 的 危险 率 并 画图 . 
17.9 正 态 失效 时 间 分 布 . 假定 产品 的 失效 时 间 分 布 
可 以 用 j=3, o =1 的 正 态 分 布 来 近似 . 
a 对 于 1=0, 1,2, =, 6 求 f(1)， F(t) 和 z(t). 
b. 作 z(t) 关 于 相应 的 t 值 图 像 , 从 而 得 到 这 个 正 
态 失效 时 间 分 布 的 危险 率 图 像 . 
17.4 电子 元 件 的 可 靠 性 . 某 种 电子 元 件 的 寿命 了 
(h) 是 一 个 随机 变量 , 密度 函数 为 
1 -1/100 
fü) = [* 
0 其 他 
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z(t) 
o! 
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图 17. 4 a=1, 2, 3 时 威 布尔 分 布 的 危险 率 图 


a. R FOA RG). 
b. 元 件 在 ;=25 h 的 可 靠 性 是 多 少 ? 
c. 求 z( 昌 并 解释 结果 . 
17.5 钻头 的 失效 时 间 ， 钻头 失效 时 间 分 布 的 密度 
函数 是 


- 2100 


2e — 0=t< om 
AD = 100 
0 其 他 
a. oK F(1). 
b. 求 钻头 在 时 刻 t 的 可 靠 性 ROG) 和 危险 率 z (1) 
的 表达 式 . 


c. 利用 b 的 结果 求 R(8) RIZ(8). 

17.6 计算 机 磁盘 组 的 失效 计算 机 磁盘 组 的 失效 
如 果 发 生 在 时 刻 t = a 前 被 认为 是 初始 失效 ， 如 果 
发 生 在 时 刻 +=pB 之 后 认为 是 磨损 失效 . 假定 在 磁 
盘 组 有 用 的 寿命 期 间 失 效 时 间 分 布 为 : 

1 
f) ^B-a 
a. SK F(2) WE RO). 
b. RÉRE z(t). 
e. ¥a=100 h, B=1 500 h, 画 出 磁盘 组 危险 率 
的 图 像 . 
d. 对 a=100 h, B=1 500 h, 磁盘 组 在 ;=500h 
的 可 靠 性 是 多 少 ? 危险 率 是 多 少 ? 
17.7 无 铅 焊接 的 失效 , 普 渡 大 学 的 机 械 工程 师 对 用 


ats 


P^ da fo # Ë, 50 T FE kk 
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TFA T DURAUT BUG RUIS RE ER T RTSEPEAH BT 
( Electronic. Components and Technology Conference , 
2005 年 5 H), 用 参数 为 a 和 8 的 威 布尔 分 布 来 近 
似 焊接 中 的 裂 颖 传播 到 最 弱点 需要 的 最 短 时 间 ( 即 
失效 时 间 ) ,研究 人 员 估计 形状 参数 a =3. 5, 平均 
失效 时 间 人 =2 370 h. 

a. 利用 这 些 估计 和 有 关 威 布尔 分 布 的 知识 , RR 


结 , 连接 点 最 普遍 的 失效 是 由 临近 晶 圆 封装 大 块 
爆 点 的 裂缝 引起 的 . 美国 国家 半导体 公司 的 研究 
员 们 用 威 布尔 分 布 估计 64L ru dk k SMD 封装 的 
焊 点 失效 时 间 (h) (Electronic Components and Tech- 
nology Conference , 2003 年 5 H), 中 位 失效 时 间 售 
计 为 590 h. 

a， 写 出 中 位 失效 时 间作 为 威 布尔 分 布 参 数 a 和 BpB 


度 参 数 B 的 估计 . 的 函数 表达 式 . 
b. 给 出 这 个 失效 时 间 分 布 危险 率 的 表达 式 . b. 求 a =1, 中 位 失效 时 间 为 590 h 时 8 的 值 . 
c. 3& t 25 000 小 时 时 的 危险 率 . c. 求 a=2, 中 位 失效 时 间 为 590 h 时 8 的 值 . 
17.8 焊接 疲劳 . 广泛 应 用 于 电子 组 件 工业 的 焊接 提 d. oR a =2, 中 位 失效 时 间 为 590 h 时 的 危险 率 . 


供 了 晶 圆 级 芯片 和 印刷 电路 板 (PCB) 之 间 的 连 


17.4 寿命 试验 : 删 失 抽 样 


寿命 试验 是 为 了 得 到 某 些 产品 个 体 寿 命 长 度 的 样本 值 而 进行 的 试验 . 特别 地 , 把 个 个 体 的 随 
机 样本 放 在 一 个 特定 的 环境 条 件 下 进行 试验 ， 并 且 试 验 直 到 他 们 失效 为 止 , 记录 的 失效 时 间 为 41， 
D, 7s s. 提供 了 产品 寿命 长 度 7 观 测 值 的 随机 样本 . 为 方便 起 见 , 令 t 表示 最 短 的 失效 时 间 , t, 3 
未 第 二 短 的 失效 时 间 ,，…, i, 表示 最 长 的 失效 时 间 , 这 些 时 间 可 能 显示 为 如 图 17. 5 那样 的 时 间 轴 上 
的 点 . 

在 许多 情况 下 ,进行 寿命 试验 确定 工业 产品 在 销售 之 前 的 质量 . 等 待 样本 中 的 最 后 几 个 个 体 失 
效 可 能 是 浪费 时 间 和 金钱 ,为 了 减少 等 待 某 些 长 寿命 个 体 的 花费 ， 试验 常常 在 一 个 指定 的 试验 时 间 
长 度 了 =t 后 结束 . 这 样 做 时 , 我 们 说 寿命 试验 在 时 间 t 处 删 失 ， 若 试验 在 固定 个 数 > 个 个 体 失效 后 
结束 ， 即 为 第 二 种 删 失 抽样 类 型 . 

如 果 寿 命 试验 在 夯 定 时 刻 志 处 删 失 ， 那么 试验 的 时 间 长 度 是 固定 的 , 这 时 容易 安排 寿命 试验 设 
备 , 但 是 在 时 刻 te 之 前 观测 到 的 失效 个 数 丸 是 一 个 随机 变量 . 所 以 , R STRERIUX [B] Or n 内 的 任 一 
整数 值 -, 也 可 能 没有 观测 到 失效 时 间 . 如 果 试 验 在 观测 到 固定 个 数 R=7 失效 时 删 失 , 那么 我 们 总 会 
得 到 7 个 失效 时 间 值 , 但 是 寿命 试验 的 长 度 是 一 个 变化 的 ， 并 且 等 于 直到 第 7 个 个 体 失效 的 时 间 长 度 
t 


r` 


还 有 许多 其 他 类 型 的 寿命 试验 过 





E L | | 
Ë. 在 有 替换 寿命 试验 中 ,一旦 一 个 产 Í r — 
品 个 体 失效 ， 就 在 试验 设备 上 被 替换 ， iit 
这 是 “个 最 大 程度 利用 试验 设备 的 过 图 17. 5 某 产品 上 个 个 体 的 失效 时 间 


程 . 男 一 种 试验 设计 为 在 变化 的 应 力 下 

试验 产品 ,以 研究 各 种 应 力 对 产品 的 影响 ， 这 种 类 型 的 试验 叫做 加 速 寿 命 试验 . 各 种 各 样 的 寿命 试 
验 过 程 的 描述 及 利用 删 失 数据 估计 失效 时 间 分 布 参数 的 方法 ， 在 本 章 的 参考 文献 中 叙述 . 

17.5 估计 指数 失效 时 间 分 布 的 参数 


求 失效 时 间 分 布 参数 估计 量 的 方法 已 经 在 前 几 章 中 介绍 过 ,可 以 利用 矩 法 (第 7 E), 极 大 似 然 
法 (第 7 章 ) 或 者 最 小 一 乘法 (第 10 章 ). 求 估计 量 的 难 易 程度 依赖 于 失效 时 间 分 布 和 参数 的 个 数 
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例如 ,基于 简单 随机 样本 求 指数 分 布 参数 的 极 大 似 然 估 计量 是 容易 的 ( 见 例 7. 5), 但 是 为 估计 威 布 
尔 分 布 参数 求解 所 得 的 极 大 似 然 方程 组 却 是 相对 困难 的 . 

基于 某 种 类 型 的 抽样 , 尤其 是 当 抽样 在 固定 时 刻 c, 删 失 时 , 得 到 估计 量 及 其 抽样 分 布 是 困难 
的 . 所 以 , 在 本 节 和 以 下 几 节 中 , 将 给 出 指数 失效 时 间 分 布 和 威 布尔 失效 时 间 分 布 的 估计 方法 , 对 各 
种 各 样 的 失效 时 间 分 布 的 估计 过 程 在 文献 或 者 关于 产品 和 系统 可 靠 性 的 教材 中 讨论 

首先 考虑 指数 分 布 的 平均 失效 时 间 8 的 估计 量 , 不 管 寿命 试验 是 否 删 失 , B 的 估计 量 都 是 相同 
的 ， 都 等 于 总 的 观测 寿命 除 以 观测 到 的 失效 个 数 > 例如 , n 个 个 体 的 随机 样本 是 来 自 指数 总 体 的 ， 
在 观测 到 第 r(r >0) 次 失效 后 结束 寿命 试验 , 那么 








p ut (n 总 的 观测 寿命 
如 果 等 到 所 有 n 个 个 体 都 失效 ,那么 + =n, 估 计量 就 是 样本 的 平均 失效 时 间 ， 
^ Ys 
B = = = 了 


n 


注意 , 对 于 删 失 和 非 删 失 抽 样 情形 ， 上 上 面 表达 式 中 的 分 子 都 等 于 在 寿命 试验 期 间 观测 到 的 个 个 体 
的 总 寿命 长 度 . 
对 有 固定 试验 时 间 c. 的 删 失 抽样 ， 


N Xr+ (n - Di, 
B = = 








- 总 的 观测 寿命 NA 
r r , 7 
注意 这 个 表达 式 中 的 分 子 仍 是 直到 寿命 试验 在 时 间 i, 结束 时 所 记录 的 个 个 体 的 总 寿命 长 度 . 
指数 分 布 的 平均 寿命 B 的 点 估计 
对 于 非 删 失 寿 命 试验 : 
QM 
B = 





对 于 失效 个 数 固定 为 r 的 期 失 抽样 : 


>: + (n -r)t, 
5 izl 
B =— I 


对 于 试 验 时 间 固 定 为 i 的 删 失 抽样 ， 


r 


Ys + (n - r)t, 
f 


r 


B= 











B 的 (1 -a)100% 置 信 区 间 的 公式 如 下 面 所 示 . 基于 在 某 一 固定 时 间 点 删 失 抽样 的 置信 区 间 只 是 
近似 的 . 
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基于 定数 ~ 的 删 失 抽样 的 B 的 (1 e) 10099 置信 区 间 
NEA) < g < 2( 总 寿命 ) 
Xan Xa an) 


其 中 : 
总 寿命 = Ya + (n = yi, 
KaKa RE B 32 的 卡 方 统计 量 的 表 中 信 ， DILECTE AME 72 处 








基于 定时 上 的 删 失 抽样 的 B 的 (1 - a)100% 近似 置信 区 间 
2( 总 寿命 ) < 8 < 2( 总 寿命 
Xan Xa - 2 


其 中 
总 寿命 = Yue(n-r, 


XP Ya -wa) 分 别 是 自由 度 为 2r+2 的 卡 方 分 布 的 上 尾 和 下 尾 呈 处 的 表 中 值 . 











| 例 17. 3 | 假定 某 种 类 型 的 飞机 发 动机 出 现 故 障 之 间 的 时 间 长 度 服从 指数 失效 时 间 分 布 有 10 6 
发 动机 参与 试验 , 直到 6 台 发 动机 出 现 故障 为 止 ， 出 现 故障 的 时 间 分 别 是 48 h. 35 h, 91 h. 62 h. 
59 h 和 77 h. 求 发 动机 平均 故障 间隔 时 间 8 的 95% 置信 区 间 . 

i 因为 寿命 试验 进行 到 观测 到 第 6 次 失效 时 停止 ,所 以 它 是 + = 6 的 删 失 抽样 试验 中 观测 到 
的 总 寿命 是 : 


总 寿命 = Y: + (n-r)t, = 372 + 364 = 736 h 
AT 2r-2(6) =12 4- Ë HH BERI Xa os fll o7 EA 23. 3367 和 4 403 79. JE Z B B) 95% rfi 


区 间 是 : 
2(736) <p< 2(736) 
23. 3367 4. 403 79 
或 者 63.08 < 8 < 334. 26. 我 们 对 此 的 解释 是 这 种 特定 类 型 的 飞机 发 动机 故障 间 隔 的 真实 平均 时 间 pB 
以 95% 的 置信 洲 在 63. 08 ~334. 26 h 之 间 . 
参考 例 17. 3. 
a 求 飞机 发 动机 的 危险 率 的 95% 置信 区 间 . 
b. 求 系统 在 50 小 时 可 靠 性 的 95% 置信 区 间 . 
St a 回忆 17.3 35, 指数 分 布 的 危险 率 是 VB. 所 以 由 例 17. 3 中 得 到 的 B 的 95% 置信 区 间 , 将 
它 变换 为 1LB 的 置信 区 间 : 





63. 08 < 8 < 334. 26 


1 1 1 
s>s 
334.26 ^ B ^ 63.08 
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0.003 x 3 < 0. 016 


所 以 飞机 发 动机 在 时 刻 c 的 危险 率 ( 已 知 发 动机 时 刻 上 生存 , 在 一 个 很 小 的 固定 时 间 区 间 内 发 动机 失 
效 的 概率 与 危险 率 成 比例 . ) 以 95% 的 置信 落 在 0. 003 ~0.016 之 间 . 
b. 由 例 17. 1 可 知 , 指数 分 布 的 累积 分 布 函 数 是 ，; 
F(t) l-e-"8 


根据 定义 ， 飞 机 发 动机 在 时 刻 t 的 可 靠 性 是 ， 


R(tg) =1-F(i0) 21 - (1 2e-*V/8) =e- 
或 对 于 加 250 h, Æ R(50) ze-9"5, IPA 63.08 < B < 334.26 等 价 于 
e - 50/63. 08 =e -50/8 xe = 50/334. 26 
0. 453 < e750 < 0. 861 
因此 , 发 动机 至 少 生 存 50 h 概率 以 95% 置信 可 能 是 最 小 为 0. 453, 最 大 为 0. 861. 


应 用 练习 

17.9 蝇 圆 级 芯片 的 可 靠 性 美国 国家 半导体 公司 
(Electronic Components and T echnology Conference , 2005 
年 5 月) 的 研究 员 们 研究 了 安装 在 诸如 移动 电话 、 导 


呼 机 和 PDA 之 类 的 手持 装置 中 的 印刷 电路 板 (PCB) . 


上 的 晶 圆 级 芯片 封装 可 靠 性 . 在 一 次 试验 中 , PCB 安 
装 在 距离 活塞 接触 点 2 mm 处 , 测量 每 个 的 失效 周期 
数 , 20 个 PCB 的 样本 数据 (模拟 的 ) 列 于 下 表 , 假定 
失效 周期 数 可 以 用 指数 分 布 近似 . 

1534 333 1179 679 1186 197 279 263 682 240 





331 508 361 593 400 2028 271 176 525 538 


a。 求 失效 平均 周期 数 的 95% SAKE, 并 解释 之 . 
b， 求 分 布 危险 率 的 95% 置信 区 间 ， 并 解释 之 . 
17.10 喷射 水 泥 沙 浆 的 强度 . 湿 搅拌 钢筋 网 微粒 硅 
混凝土 (叫做 喷射 水 沁 沙 桨 ) 在 斯 堪 的 纳 维 亚 广 泛 
地 应 用 , 现在 已 经 进入 美国 市 场 . 据说 这 种 材料 至 
少 有 28 天 的 9 000 16/ire? 压 强 的 抗 断 强度 , 为 了 研 
究 新 产品 的 抗 断 强度 , 7 块 喷射 水 泥 沙 浆 受 到 每 天 
9 000 Ib/in” 的 压强 直到 失效 ， 失 效 时 间 分 别 是 33 、 
35, 61, 38, 21, 41 和 52 X. 假定 喷射 水 泥 沙 浆 受 
到 9 000 i6/in* 压 强 时 有 指数 失效 时 间 分 布 . 
a. 求 直 到 喷射 水 泥 沙 浆 失 效 的 平均 时 间 B 的 90% 
置信 区 间 . 
b， 求 喷射 水 泥 沙 浆 在 指定 的 最 短 时 间 28 天 之 前 不 
会 失效 概率 的 90% 置信 区 间 . 
c. 求 喷射 水 泥 沙 浆 危险 率 的 90% 置信 区 间 . 
17.11 机 车 的 寿命 长 度 . 利用 删 失 灿 样 研究 某 种 类 
型 机 车 的 平均 寿命 (mile) 的 估计 ( Technometrics , 


. 1985 年 5 H). 96 辆 机 车 或 者 一 直 运 行 到 

135 kmile, 或 者 失效 为 止 , 其 中 37 辆 机 车 在 运行 
135 kmile 之 前 便 失效 , 表 中 给 出 这 些 机 车 失效 时 运 
行 的 英里 数 , 假定 失效 时 间 服 从 指数 分 布 , 构造 机 
车 失效 平均 英里 数 的 95% 置信 区 间 . 
22.5 57.5 78.5 91.5 113.5 122.5 
37.5 66. 5 80.0 93.5 116.0 123.0 
46. 0 68.0 81.5 102.5 117.0 127.5 
48.5 69.5 82.0 107.0 118. 5 131.0 
51.5 76.5 83.0 108. 5 119.0 132.5 
53.0 77.0 84. 0 112.5 120.0 134. 0 
54.5 


资料 来 源 : Schmee, J. , Gladstein, D. , and Nelson, W. 

" Confidence limits for parameters of a normal distribution from 
singly -censored samples, using maximum lilelihood" » Technomet- 
rics, Vol. 27, No. 2, May, 1985 p. 119. 


17.12 集成 电路 芯片 . 假定 集成 电路 芯片 具有 指数 
失效 时 间 分 布 . 对 15 个 电路 芯片 进行 加 速 寿命 斌 
验 , 直到 5 个 失效 . 前 5 个 失效 分 别 发 生 在 18.2, 
19.5, 24.8, 31.0, 45. 6( 千 小 时 ). 

a. 求 电路 芯片 平均 失效 间隔 时 间 的 95% 842] JS]. 
b. 求 电路 芯片 在 20 000 h 的 可 靠 性 的 95% 置信 区 间 . 

17.13 高 可 靠 性 的 电容 器 . 对 100 个 高 可 靠 性 电容 器 
样本 进行 000 h 的 试验 . 在 这 段 时 间 内 , 只 有 三 个 电 
容器 出 现 故障 , 故障 时 间 分 别 是 810, 1 422 和 1 816 h. 
假定 故障 时 间 服 从 指数 分 布 , 构造 电容 器 平均 故障 间 
隔 时 间 的 9% 置信 区 间 , 解释 这 个 区 间 . 

17. 14 高 可 靠 性 的 电容 器 ( 续 ). 参考 练习 17.13. 

a. 求 电容 器 危险 率 的 90% 置信 区 间 . 
b. 求 电容 器 在 3 000 h 可 靠 性 的 99% 置信 区 间 . 
c. 求 电容 器 在 2 000 h 之 前 失效 概率 的 99% 置信 区 间 |. 
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17.6 估计 威 布尔 失效 时 间 分 布 的 参数 


可 以 用 极 大 似 然 方 法 (7. 3 节 中 讨论 ) 得 到 威 布尔 分 布 形状 参数 和 尺度 参数 的 估计 , 但 是 过 程 是 
困难 的 且 超 出 了 本 教材 的 范围 , 对 此 感 兴趣 的 读者 参见 本 章 末尾 列 出 的 参考 文献 ， 极 大 似 然 法 的 缺 
点 是 要 通过 解 一 个 复杂 的 非 线 性 联 立方 程 组 才能 得 到 a 和 8 的 估计 , 这 种 方法 的 优点 是 当 样本 量 n 
大 时 , 极 大 似 然 估计 量具 有 已 知 均值 和 方差 的 近似 正 态 的 抽样 分 布 , 由 此 可 以 用 7.3 节 所 述 的 方法 
构造 大 样本 置信 区 间 . 

用 最 小 二 乘 估计 法 代替 极 大 似 然 法 来 估计 a 和 6. 回忆 威 布尔 分 布 的 累积 分 布 函 数 是 ， 

F(t) =1 一 ee 
那么 生存 到 时 间 + 的 概率 是 : 
R(t) x1- F(t) 2e-" 8 
并 且 


等 式 两 边 同 时 取 自 然 对 数 , 得 





In[ - In R(:)] = - Ing * alnt 
为 了 利用 最 小 二 乘法 ,需要 基于 寿命 试验 数据 估计 生存 函数 . 做 到 这 点 的 一 种 方法 是 对 个 个 
体 的 随机 样本 进行 寿命 试验 , 并 在 一 个 时 间 单 元 (例如 一 个 星期 或 -- 个 月 ) 结束 后 、 两 个 时 间 单 元 
后 , 一 般 地 , 在 i 个 时 间 单 元 后 , i=1, 2,…, 计算 生存 的 个 数 . 时 间 区 间 如 图 17. 6 所 示 , 在 时 刻 ; 的 
生存 比率 的 估计 为 : 
R(i) = 
其 中 , n, = 在 第 i 个 时 间 单 元 结束 时 生存 的 个 数 ; n = 投入 试验 的 个 体 总 数 . 
对 i=1, 2,… 计 算 R(i)， 然后 对 于 数据 点 (%;, y), i=1, 2,… 其 中 第 i 个 数据 点 是 : 
y;=h[ -In R(i)] H x; =ln 
拟 合 最 小 二 乘 直线 : 
In[ -In È(i)] = -In8+e Ini 
; UA B^ 


MaA A HERE 





[ | | | | | J 
0 1 2 3 4 5 6 a i 


时 间 


图 17.6 时 间 
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上 述 过 程 概括 在 下 面 框 格 中 , 并 且 用 一 个 例子 说 明 . 


威 布尔 寿命 参数 a 和 的 点 估计 
假定 将 于 个 个 体 的 样本 投入 试验 ,记录 在 各 个 时 间 区 间 结 束 时 生存 的 个 体 数 
步骤 1: 对 于 每 个 时 间 区 间 ， 求 R(i) =n/n, 其 中 n= 在 第 i 个 区 间 结 束 时 生存 个 数 ，n 二 投入 试验 的 个 
体 总 数 . 
步骤 2: 对 于 每 个 时 间 区 间 , F y, =In[ -In(R(i))]. 
步骤 3: 对 于 每 个 时 间 区 间 , 计算 x Ini). 
BRA: 利用 在 第 2 ~3 步 中 计算 的 变量 , 拟 合 简单 线性 回归 模型 EG) = B +B x. 


步骤 5: 威 布尔 参数 估计 值 为 =B ,B=-e h, 











L 


| 例 17.5 | 液压 油封 的 制造 商 进行 了 一 项 试验 , 在 这 项 试验 中 , 油封 承受 了 使 用 油封 的 液体 系统 中 
保持 的 正常 压力 的 200% 的 液压 . 有 100 个 油封 投入 试验 , 在 7 天 时 间 中 ,每 天 结束 时 记录 生存 的 个 
数 , 列 于 表 7.1. 

a. 利用 这 些 数据 估计 威 布尔 分 布 的 参数 a 和 有 

b. 求 a 和 8B 的 95% 和 置信 区 间 . 

解 : a 第 1 步 是 对 7 个 时 间 区 间 中 的 每 表 17.1 每 天 生存 个 数 


个 计算 R(i) 和 In[ -In(RR(i))]， 计算 结果 在 表 天 1 2 3 4 5 6 7 
17.2 中 给 出 . 对 这 些 数据 的 简单 线性 回归 的 


SAS 输出 如 图 17.7 所 示 . 由 输出 可 以 看 出 ,最 生存 人 数 O 4 3 a 13 7 4 
LL t. 
小 二 乘 估计 (阴影 部 分 ) 是， 








Êo = -1.05098 局 -1.110 19 
因为 Bo = -InB, B, ==, RITA 
à 2B, 21.110 19 
及 
Bo= -In 有 或 B=e-B -2.86045 
表 17.2 例 17.5 的 计算 结果 





BHL i z;zlni 生存 个 数 RG) -ln R(i) y; =ln[ -In R(i)] 

1 0 69 0. 69 0.371 06 — 0. 991 38 
2 0. 693 15 48 0. 48 0. 73397 — 0. 309 29 
3 1. 098 61 33 0. 33 l 1. 108 66 0. 103 15 
4 1. 386 29 21 0. 21 1. 560 65 0. 445 10 
5 1. 609 44 13 0. 13 2. 040 22 0.713 06 
6 1. 791 76 7 0. 07 2. 659 26 0. 978 05 
7 


1. 945 91 4 0. 04 3.218 88 1. 169 03 
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" > 
产品 和 系统 的 可 靠 性 
The REG Procedure 
Model: MODEL! 
Dependent Variable: Y 
Nunber of Übservations Read 7 
Number of Observations Used 7 
finalysis of Variance 
Sun of Mean 
Source DF Squares Square F Value Pr > T 
Model 1 3.46814 3.46814 1074.81 «.0001 
rror 5 0.01613 9.00323 
Corrected Total B 3.48428 
Root MSE 0.05680 R-Square 0.9954 
Dependent Mean 0.30110 fidj R-8q 0.9944 
Coeff Var 18.86544 
Parameter Estimates 
Parameter Standard 
Variable DF Estimate Error t Value Pr > iti 353 Confidence Limits 
Intercept 1 -1.05098 0.04650 -22.60 <. 0001 -1.17050 ~Q. 93146 
x 1 1.11019 0.03386 32.78 «.0901 1.02314 1.19724 











图 17.7 [17.5 中 简单 线性 回归 的 SAS 输出 
因此 , 根据 最 小 二 乘法 ,用 参数 为 1. 110 19, 8 = 2. 860 45 的 威 布尔 分 布 作为 液压 油封 的 失 


效 时 间 分 布 的 模型 . 
b. a 和 有 的 置信 区 间 可 以 由 po 和 pi 的 置信 限 得 到 . 因为 w=B), 所 以 @ 的 置信 区 间 就 是 通常 8, 


的 回归 置信 区 间 . 将 Bo 的 上 下 告 信 限 代入 关系 式 8 = e P 8] p 的 置信 限 . 

Bo FI B, 的 95% 置信 区 间 在 图 17.7 的 SAS 输出 中 着 重 显示 . B, 的 95% 置信 区 间 是 (1.023， 
1.197) , 这 也 是 威 布尔 参数 a 的 95% 置 信 区 间 . Bo 的 95% 置 信 区 间 是 ( -1. 170 50，-0.931 46), 因 
此 威 布尔 参数 6B 的 95% 置 信 区 间 是 : 


( e9 931 46 R el: 170 505 


或 (2. 5382, 3. 2236). 
| 例 17.6 | 利用 例 17. 5 得 到 的 a 和 8p 的 估计 , 求 投入 试验 的 液压 油封 至 少 生存 3 天 的 概率 . 
解 ” 回 忆 在 威 布尔 分 布下 生存 到 时 刻 to 的 概率 是 : 
R(to) =1 ~- F(19) 2e 8/8 
H to =3 天 时 , 将 估计 值 &=1.110 19 和 6 =2. 860 45 代入 方程 ， 
R(3) =e-3 /2.86045 -1.18375 -0 306 13 
因此 , 估计 的 液压 油封 至 少 生存 3 天 的 概率 为 0. 306 13. 

X n Bhif, 仍然 可 以 用 最 小 二 乘法 估计 威 布尔 分 布 的 参数 , 但 是 推荐 方法 是 在 观测 到 每 个 失 
效 时 间 后 ,估计 生存 到 时 刻 c 的 概率 , R(t) =1 - F(t). 用 于 最 小 二 乘法 的 数据 点 是 [ n, RO) ] ， 
[tas R(5)],-, [t,, R(t,)], 其 中 ti 是 第 一 次 观测 到 的 失效 时 间 , t 是 第 二 次 观测 到 的 失效 时 间 ， 
等 等 . 当 用 这 种 方法 定义 的 数据 点 时 , 例 17.5 中 生存 率 的 估计 修正 为 : 


n; +1 





R(t) = 


n+l 


其 中 n; 是 观测 到 第 i 个 失效 时 间 c; 时 的 生存 个 数 , n 是 样本 容量 9. 





O 一些 统计 学 家 用 Ra ) = (n, +1⁄2)/n, W Miller and Feund( 1977). 
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总 之 , EE a 和 B 不 具有 po fü p, 的 通常 最 小 二 乘 估计 的 性 质 . 响应 变量 


y =l[ -In R(¢)] 


不 是 正 态 分 布 的 随机 变量 , 另外 , y 的 观测 值 是 相关 的 . 这 是 因为 在 一 个 时 间 点 的 生存 个 数 依赖 于 之 
前 的 某 个 时 间 点 观测 的 个 数 , 这 些 违 反 回 归 分 析 假定 影响 估计 量 性 质 的 程度 是 未 知 的 , 但 是 当 样本 


量 ”和 观测 到 的 失效 数 "大 时 , 这 大 概 是 微不足道 的 . 


(9) 应 用 练习 
17.15 计算 机 内 存 芯 片 ， 假 定 计算 机 内 存 芯 片 的 寿 
命 长 度 (年 ) 服 从 威 布尔 失效 时 间 分 布 . 为 了 估计 
威 布尔 参数 a 和 8B, 将 50 个 芯片 投入 试验 , 在 8 年 
时 间 内 的 每 年 结束 时 记录 生存 个 数 ,数据 如 下 表 
所 示 . 
年 1 2 3 4 5 6 7 8 
生存 个 数 47 39 29 18 li 5 3 1 








a 用 最 小 二 乘法 求 MB 的 估计 . 
b. 构造 a 的 95% 置 信 区 间 . 
c. 构造 B 的 95% 置 信 区 间 . 

17.16 计算 机 内 存 芯 片 ( 续 ). 参考 练习 17. 15. 

a. 利用 a 和 8B 的 估计 , 求 内 存世 片 在 5 年 之 前 失 
效 的 概率 . 
b. 估计 内 存 蕊 片 在 ;=7 时 的 可 靠 性 . 

17.17 计算 机 内 存 芯 片 ( 续 ). 参考 练习 17. 15. 

a. 利用 a 和 的 最 小 二 乘 估计 , 求 危险 率 z(1) , 并 
作 图 . 
b. 计算 1=4 年 时 的 危险 率 , 并 解释 这 个 值 . 

17. 18 滚珠 轴承 的 寿命 长 度 . 对 “最 弱 环 "产品 , 即 由 
多 个 部 件 组 成 的 产品 ( 如 滚珠 轴承 ) ， 当 第 一 个 部 件 
(或 最 弱 环 ) 失 效 时 产品 就 失效 , 工程 师 常用 威 布尔 失 
效 时 间 分 布 . Nelson ( Journal of Quality Technology, 
1985 年 7 月 ) 将 威 布尔 分 布 用 于 n=138 滚珠 轴承 样本 
的 寿命 长 度 . 下 表 给 出 了 每 100 h 结束 时 仍 在 运行 的 
轴承 数 , 一 直到 所 有 的 轴承 都 失效 为 止 . 





nn O 
小 时 数 ( x100) 1 2 3 4 5 6 7 
轴承 数 138 114 104 6 37 29 20 








小 时 数 ( x 100) 8 12 13 17 19 24 51 





轴承 数 10 8 6 4 3 2 1 
SEE LLL $ 6 343 3 2 1l. 


资料 来 源 : Nelson, W. “Weibull analysis of reliablility data 
with few or no failures. " Journal of Quality Technology. Vol. 


17, No. 3, July 1985, p. 1413€ 1). © 1985 美国 质量 控 


制 协会 , 经 许可 重印 . 

a. 用 最 小 二 乘法 估计 威 布尔 参数 w M B. 

b. 构造 a BJ 99% SAKE, 如 果 可 以 使 用 回归 计 
算 软 件 包 , SK 8 的 99% 置 信 区 间 . 

c. 估计 滚珠 轴承 在 1 =300 h 的 可 靠 性 . 

d. 估计 滚珠 轴承 在 200 h 之 前 失效 的 概率 . 


17.19 洗衣 机 的 维修 . 洗衣 机 制造 商 进 行 寿命 


试验 . 在 试验 中 , 3 年 时 间 内 监视 12 台新 洗衣 

HL, 记录 每 台 洗 衣 机 的 大 修 时 间 . 在 3 年 试验 

期 结束 时 , 有 2 台 洗 衣 机 没有 要 求 大 修 , 其 余 

10 台 洗 衣 机 的 失效 时 间 (月) 分 别 是 14, 28, 

9,13,6,20, 10, 17, 30 和 20. 假定 洗衣 机 

的 寿命 (年 ) 服 从 未 知 参 数 a 和 8 的 威 布 尔 失 

效 时 间 分 布 . 

a. 构造 一 个 数据 表 表 示 在 每 年 结束 时 仍然 生存 
( 即 没 有 大 修 过 ) 的 洗衣 机 台数 . 

b. 对 a 中 的 数据 表 利 用 最 小 二 乘法 求 w 和 有 
的 估计 . 

e. 3K a BJ 95% Etfi P< [8] , 如 果 可 以 使 用 回归 计算 
软件 包 , 求 B 的 95 色 置信 区 间 . 

d. 制造 商 保证 所 有 的 机 器 在 两 年 内 不 会 大 修 , 用 
a 和 有 的 最 小 二 乘 估计 , 求 在 此 保证 下 修理 一 
台新 洗衣 机 的 概率 . 


17.20 重新 组 装 的 液压 泵 . 为 了 评估 在 航行 器 重新 


工作 设备 中 重新 组 装 的 液压 泵 的 性 能 , 投入 20 6 
有 泵 进行 寿命 试验 , 在 6 周 时 间 内 的 每 周 结束 时 记录 
仍然 运行 的 泵 台数 , 列 于 下 表 . 
星期 1 2 3 4 5 6 
RHR 14 11 9 7 5 4 


a. 利用 这 些 数 据 估计 威 布尔 失效 时 间 分 布 的 参数 
a FI B. 

b. 构造 a 的 90% 置信 区 间 ,， 如 果 可 以 使 用 回归 计 
算 软件 包 , SK B B5 90% 置信 区 间 . 

c. 求 经 重新 组 装 的 液压 泵 在 1 =2 周 时 的 可 靠 性 ， 
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17.7 ”系统 可 靠 性 


系统 (电子 、 机 械 或 者 二 者 的 组 合 ) 是 由 元 件 组 成 的 , 其 中 某 些 元 件 组 合 形成 一 个 小 的 子 系统 
用 大 写字 母 来 表示 系统 的 元 件 , 并 且 把 它 放 在 一 个 方块 中 , 如 图 17. 8 所 示 的 两 个 系统 ,每 个 系统 都 
由 三 个 元 件 A、B、C 组 成 . 

假定 一 个 系统 由 % 个 元 件 组 成 ， 如 果 任 
何 一 个 元 件 失 效 时 , 系统 就 失效 , 称 它 为 串联 Ig 
系统 . 一 个 由 三 个 元 件 组 成 的 串联 系统 如 图 c 
17. 8a 所 示 . 如 果 仅 当 所 有 元 件 都 失效 时 系统 EN 
TRA, 称 它 为 并 联系 统 . 一 个 由 三 个 元 件 组 四 
成 的 并 联系 统 如 图 17. 8b 所 示 . a) 串联 系统 b) 并 联系 统 

图 17. 9a RIRH 5 NEFA, B.C. D. E 
组 成 的 系统 , 元 件 D 和 下 形成 二 元 件 的 并 联 。 ” 图 17.8 由 三 个 元 件 A、B、C 组 成 的 两 个 系统 
了 系统 ,这 个 子 系统 和 元 件 A, B. C 串联 连接 , 图 17. 9b 表示 两 个 并 联 子 系统 串联 连接 的 个 系统 ， 
第 一 个 并 联 子 系统 包含 三 个 元 件 A、B、C, 第 二 个 子 系统 包含 两 个 串联 子 系统 ,其 中 第 一 个 系统 由 
元 件 D、E 组 成 , 第 二 个 系统 由 元 件 F、G 组 成 

定义 17. 6 . 串联 系统 是 它 的 任何 一 个 元 件 失效 便 失效 的 系统 . 

定义 17.7 ”并联 系统 是 它 的 所 有 元 件 失效 时 才 失 效 的 系统 . 


a) b) 
图 17.9 两 个 系统 
假定 元 件 i 的 可靠 性 , 即 在 规定 条 件 下 具有 正常 功能 的 概率 是 p;, 而 且 系统 的 个 元 件 是 相互 独 
LÉ, 即 假定 一 个 元 件 的 运行 不 影响 其 他 元 件 的 运行 . 那么 系统 的 可 靠 性 可 以 利用 概率 的 乘法 法 则 
来 计算 . 
因为 串联 系统 只 有 在 所 有 的 元 件 都 运行 时 才 运 行 ， 所 以 串联 系统 的 可 靠 性 是 ; 
P(BIK 3883847) = P( 所 有 元 件 运行 ) 
又 因为 元 件 工 作 是 相互 独立 的 ， 所 以 可 以 应 用 概率 的 乘法 法 则 ; 
R( 串 联系 统 运行 ) = P(A 运行 )P(B 运行 ) PK 运行 ) =pApB…PK 
定理 17. 1 由 上 个 独立 工作 的 元 件 A, B, …, K 组 成 的 串联 系统 可 靠 性 是 ， 
(串联 系统 运行 ) =papp…pk 
其 中 pi 是 第 i(i=A,B,…, KK) 个 元 件 运行 的 概率 . 
包含 个 元 件 的 并 联系 统 可 靠 性 可 以 用 类 似 的 方法 计算 ， 因为 只 有 当 所 有 元 件 失效 时 ,并 联系 
统 才 失 效 ， 所 以 








aHes HS] 


P( 并 联系 统 失效 ) = (1 -ps)(1 -pPg) (1 -pk) 
并 且 


AF p 
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P( 并 联系 统 运行 ) =1 - P( 并 联系 统 失效 ) =1 (1 -pa)(1 — pi) (1 -px) 
定理 17.2 由 上 个 独立 工作 的 元 件 组 成 的 并 联系 统 可 靠 性 是 : 
P( 并 联系 统 运行 ) =1 - (1 - pA) (1 - pg): (1 - py) 

JP p; 是 第 ii=A,B，…,K) 个 元 件 运行 的 概率 . 

只 要 系统 满足 元 件 工作 相互 独立 的 假定 , 定理 17. 1 和 17. 2 就 可 以 用 来 计算 串联 系统 、 并 联系 
统 或 任意 组 合 的 可 靠 性 . 下 面 举 例 说 明 这 种 方法 . 
已 知 p, 20.90, ps 20.95, pc =0.90, RE 17. 8a 所 示 串 联系 统 的 可 靠 性 , 

解 ” 因 为 这 是 由 三 个 元 件 A、B 和 C 组 成 的 串联 系统 , 由 定理 17. 1 可 知 , 这 个 系统 的 可 靠 性 是 ; 

已 (系统 运行 ) =pAppgpc = (0. 90)(0. 95) (0. 90) =0. 7695. 

ORARE] (5050117. 7 的 元 件 是 并 联 连接 的 , 如 图 17. 8b 所 示 . 求 系统 的 可 靠 性 . 

f ”为 了 求 这 个 并 联系 统 的 可 靠 性 , 应 用 定理 17.2; 

P( 系统 运行 ) -1-(1-p4) (1 - pg) (1-pc) 21 - (0. 10) (0.05) (0. 10) =1 -0.0005 =0. 9995. 

15117. 7 和 17.8 说 明 囊 联 系统 的 可 靠 性 总 是 小 于 它 的 最 小 可 靠 元 件 的 可 靠 性 , 相反 ,并 联系 统 的 
可 靠 性 总 是 大 于 它 的 最 大 可 靠 元 件 的 可 靠 性 . 

为 了 求 包含 子 系统 的 系统 可 靠 性 , 首先 求 最 小 子 系统 的 可 靠 性 , 然后 再 求 包含 这 些 子 系统 的 系 
统 可 靠 性 . 
EE] 求 图 17.9a 所 示 的 系统 可 靠 性 , 已 知 以 下 的 元 件 可 靠 性 : p, =0.95, py 20.99, pc = 
0.97, py =0. 90, pr = 0. 90. 

解 ”整个 系统 是 由 三 个 元 件 A、B、C 和 一 个 子 系统 串联 而 成 . 并 联 子 系统 由 元 件 D 和 下 组 成 ， 
如 右 图 所 示 . 

这 个 子 系统 的 可 靠 性 是 : B" 

PCT BE DIE 3847) =ppg 21 - (1- pp) (1 - pg) = 1 - (0.1) (0.1) =0.99 Em 

现在 把 整个 系统 看 成 是 由 4 个 元 件 组 成 ; 元 件 A、B、C 和 子 系统 (D, E) RE E] 
连接 . 为 了 求 它 的 可 靠 性 , 应 用 定理 17. 1, 整个 系统 的 可 靠 性 是 : 

P( 系 统 运行 ) 7 PAPBPcPpg = (0. 95) (0.99) (0.97) (0. 99) =0. 903 162 2. 

| 例 17. 10 | 求 图 17. 9b 所 示 的 系统 可 靠 性 , EA pa =0.90, py =0.95, pc =0.95, pp =0.92, pp = 
0.97, pp =0.92, pe =0. 97. 

解 ” 观察 图 17. 9b 说 明 系统 是 由 两 个 并 联 的 子 系统 串联 而 成 . 第 一 个 并 联 子 系统 包含 元 件 A、B 
和 C, 第 二 个 是 两 个 串联 子 系统 并 联 的 子 系统 , 其 中 第 一 个 包含 元 件 D ME, 第 二 个 包含 元 件 下 
和 G. 

因为 元 件 对 (D, E) RCF, G) 的 可 靠 性 是 一 样 的 , 所 以 这 两 个 串联 子 系统 : 


oHe H 和 drHs| 
可 靠 性 也 是 一 样 的 . 由 定理 17. 1, 这些 串联 子 系统 的 可 靠 性 是 ， 
Poe =Pre = pppE =prpc = (0.92) (0. 97) =0. 8924 
现在 考虑 包含 这 两 个 串联 子 系统 的 并 联 子 系统 的 可 靠 性 ， 


J da Fo A NEUE E: 
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由 定理 17. 2 , 我 们 有 





a 


Porre =l - (1 - ppg) (1 - ppc) 21 - (1 -0. 8924) (1—0.8924) 21 -0.011 577 8 «0. 988 422 2 
下 面 来 计算 由 元 件 A、B、C 组 成 的 并 联 子 系统 的 可 靠 性 : 


由 定理 17. 2 ， 





Pasc 721 - (1 7 pA) (H - pg) (1 - pc) 21 - (1-0.90) (1-0.95) (1—0.95) 


=1 - 0. 000 25 20. 999 75 


已 经 计算 了 两 个 并 联 子 系统 的 可 靠 性 , 这 两 个 子 系统 是 串联 的 , 如 下 图 所 示 : 





所 以 , 整个 系统 的 可 靠 性 是 : 


P( 系统 运行 ) =pApcppEFc = (0. 999 75) (0. 988 422 2) = 0. 988 175 1. 


应 用 练习 

17.21 串联 系统 的 可 靠 性 . 考虑 由 4 个 元 件 A, B. 
C. D 组 成 的 串联 系统 ,元 件 运 行 的 概率 分 别 是 
pa =0. 88, p, 20.95, pc 20.90, pp =0. 80, 求 系统 
的 可 靠 性 . 

17.22 并 联系 统 的 可 靠 性 . 考虑 由 4 个 元 件 A. B. 
C. D 组 成 的 并 联系 统 , 元 件 运行 的 概率 分 别 是 
pa =0.90, ps 20.99, p, 20.92, pn 20.85, RA 
统 的 可 靠 性 . 

17.23 测试 系统 软件 的 安全 性 . 在 Reliability Engi- 
neering and System Safety( 2006 年 1 月 ) 中 , 韩国 高 
等 科学 与 技术 研究 院 的 核 和 量子 工程 师 设 计 了 一 
种 测试 系统 软件 的 数字 安全 系统 . 考虑 系统 软件 
代码 中 的 个 独立 的 软件 语句 ,每 一 个 失效 的 概 
率 是 p;(i=1, 2, =, k), 如果 至 少 有 一 个 软件 代 
码 语句 失效 时 ,系统 软件 就 失效 ， 

a 系统 软件 代码 语句 是 串联 还 是 并 联 的 ? 解 


PEZ. 
b. 给 出 系统 软件 可 靠 性 的 表达 式 . 

17.24 检测 计算 机 系统 的 入 侵 者 . 华盛顿 海军 研究 
实验 室 的 高 保证 计算 机 系统 中 心 开发 了 几 种 理论 
模型 检测 高 风险 性 计算 机 系统 的 人 侵 者 . ( Interna- 
tional Information Assurance Workshop, 2005 年 3 
A). 考虑 一 个 攻击 有 两 个 服务 器 的 计算 机 系统 的 
本 地 入 侵 者 , 服务 器 A 以 0. 95 的 概率 检测 到 人 侵 
者 , 服务 器 B 以 0. 99 的 概率 检测 到 人 侵 者 . 

a. 如 果 两 个 服务 器 是 串联 的 , 求 检 测 到 入 侵 者 的 
概率 ， 

b. 如 果 两 个 服务 器 是 并 联 的 , 求 检测 到 入 侵 者 的 

c. 假设 系统 设计 为 每 次 只 运行 两 个 服务 器 中 的 一 
+. 服务 器 A 运行 1⁄3 的 时 间 , 服务 器 B 运行 
2/3 的 时 间 . 求 系统 检测 到 本 地 入侵 者 概率 . 

17.25 8 个 元 件 的 系统 可 靠 性 . 一 个 系统 由 8 个 元 
IFAR, 如 下 图 所 示 . 已 知 每 个 元 件 运行 的 概率 分 
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S9 p, 0.90, p, 20.95, pe 20.85, p, -0.85, — 17.26 电路 的 可 靠 性 . 考虑 包含 两 个 支 路 的 电路 ， 


pe =0.98, pr =0. 80, pç 20.95, pi 20.95, 求 系统 第 一 个 支 路 由 元 件 A、B、C 并 联 组 成 , 第 二 个 支 
的 可 靠 性 . .. 路 由 元 件 D. E 并 联 组 成 . 假定 每 个 元 件 的 可 靠 性 
分 别 是 p, =0.95, p, = 0.95, pe = 0.90, pp = 


0. 90, p, =0. 98. 

a. 如果 两 个 支 路 是 串联 的 , 求 系统 的 可 靠 性 . 

b. 如果 两 个 支 路 是 并 联 的 , 求 系统 的 可 靠 性 . 
17.27 三 个 元 件 的 系统 可 靠 性 . 由 三 个 相同 元 件 组 

成 的 系统 可 靠 性 是 0.95, 求 每 个 元 件 运 行 的 概率 

必须 是 多 少 , WR: 

a. 元 件 是 串联 的 ? 

b. 元 件 是 并 联 的 ? 




















快速 回顾 
重要 公式 





可 化 性 (生存 函数 ) : RG) = 1 - FC ,其 中 FC) SUB EROR 
ERR: z(t) - f')/RG) 


估计 指数 分 布 平均 寿命 : 
没有 删 失 的 寿命 试验 :后 =F 


i=} 


EA IUBE f = L Y [n + (n = r)5,1 
i=l 
定时 4 BRM: B LY in yn -mi 
Tof1 
置信 区 间 ; 2 AFR) / xo; SBS 总 寿命 )/ hs o; 
估计 威 布尔 寿命 分 布 的 参数 : 
asfi, B=e- Po, rh EC) =B «Biss yi =i[ -ln( ROD)], x, =l), RCO) -n/n 
串联 系统 的 可 靠 性 : pape pe, EP p; = P( 第 ;个 元 件 运行 ) 
并 联系 统 的 可 靠 性 : 1 - (1 - p.) (17 py) (1 -px)，, 其 中 p; =P( 第 i 个 元 件 运行 ) 


c 
符号 汇集 


: 
qj = 说 — B 





F(t) 累积 分 布 函数 
R(t) 可 靠 性 (生存 ) 函数 
z(t) 危险 率 
-一 一 
本 章 总 结 提示 
* 产品 的 可 靠 性 是 产品 在 一 段 指定 时 间 内 运行 的 概率 . 
。 产品 的 失效 时 间 是 产品 失效 的 时 间 . 


产品 和 系统 的 可 靠 性 
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。 经 常 使 用 的 失效 时 间 分 布 是 指数 、 威 布尔 和 正 态 分 布 . 
° 产品 的 危险 率 与 已 知 产品 已 经 生存 到 时 刻 1， 产品 将 在 很 短 的 固定 时 间 区 间 内 失效 的 概率 成 


比例 . 


° 寿命 试验 是 将 许多 产品 个 体 投 入 试验 , 记录 每 个 个 体 观 测 的 失效 时 间 . 
° 有 时 用 删 失 样本 缩短 寿命 试验 的 时 间 长 度 ， 即 在 观测 到 指定 的 失效 个 数 后 或 经 过 指定 的 时 间 


后 停止 的 寿命 试验 . 


° 串联 系统 是 如 果 它 的 任 一 个 元 件 失效 就 失效 的 系统 . 
° 并 联系 统 是 只 有 当 它 的 所 有 元 件 都 失效 时 才 失 效 的 系统 . 


补充 应 用 练习 

17.28 指数 失效 时 间 . 某 种 元 件 的 失效 时 间 服 从 均 
值 为 6=3 h 的 指数 分 布 . 

a. 求 元 件 在 1=2 h 之 前 失效 的 概率 . 
b. 元 件 在 1=5 h 的 可 靠 性 是 多 少 ? 解释 这 个 值 . 
c. 求 元 件 危 险 率 , 并 作 图 , 解释 结果 . 

17.29 威 布尔 失效 时 间 . 假定 荧光 灯 的 寿命 长 度 
(bh) 服 从 参数 为 a =0.05, 8 =0.70 的 威 布尔 失效 
时 间 分 布 . 

a. 求 荧光 灯 在 上 =1 000 h 之 前 失效 的 概率 . 
b. 求 荧光 灯 在 :=500 h 的 可 靠 性 ， 并 解释 这 个 值 . 
c RIKTE t =500 h 的 危险 率 ， 并 作 图 , 解释 结果 . 
17.30 45 £ žk Bj B. 考虑 由 如 下 密度 函数 给 出 的 
a =2, B =1 的 伽 玛 失效 时 间 分 布 
_ te `° 0=;== 
Kos x. 
a. OR F(t). (RF: Je à = ie” + feo) 


b. 求 可 靠 性 RCO) 和 危险 率 z (1) Bess. 
c. 利用 b 的 结果 求 R(3) 和 z(3), 解释 这 些 值 . 


17.31 均匀 失效 时 间 . 考虑 由 如 下 密度 函数 给 出 的 
均匀 失效 时 间 分 布 
1 
G) = [^ Oxt«g 
0 其 他 


a. SR F(t), R(t) I z(t). 
b. 车 B=10, MH £20, 1, 2, .…,5 时 的 危险 率 
z(t) WRR. 

e. 若 B=10, 计算 系统 在 :=4 时 的 可 靠 性 . 

17.32 CPU 失效 . 为 了 调查 某 种 类 型 微型 计算 机 中 
央 处 理 器 (CPU) 的 性 能 , 投入 20 个 CPU 进行 
5 000 h 的 试验 . 当 试 验 结束 时 , 有 4 个 CPU 失效 ， 
失效 时 间 分 别 是 1 850, 2 090, 3 440, 3 970 h. 假定 
失效 时 间 服 从 负 指 数 分 布 . 
a. 求 微 型 计算 机 CPU 失效 的 平均 时 间 B BJ 90% =: 


Të < lJ. 
b. 求 CPU 在 :=2 000 h 可 靠 性 的 90% 置信 区 间 . 
c. R CPU 危险 率 的 90% 置信 区 间 . 

17.33 导管 的 抗 腐 他 性 . 某 种 导管 的 涂 层 设计 为 抗 
腐蚀 的 , 投入 500 根 涂 层 管 进 行 试验 , 使 其 处 于 
90% 的 盐酸 溶液 中 . YES h 内 的 每 个 小 时 结束 时 ， 
记录 抗 住 了 腐蚀 的 导管 数 , 如 下 表 所 示 . 

— _ _—_ _ 


小 时 1 2 3 4 5 
抗 腐蚀 数 48 280 146 51 15 


a 利用 表 中 数据 估计 威 布尔 失效 时 间 分 布 的 参数 
a ffl B. 

b. 利用 a 中 得 到 的 估计 , 求 涂 层 管 的 危险 率 z(t) 
和 可 靠 性 RO 的 表达 式 . 

e. 求 一 根 涂 层 管 在 相似 的 试验 条 件 下 至 少 能 抵抗 
1 h 腐蚀 的 概率 , 

17.94 7 个 电子 管 的 系统 . 一 件 装置 包含 如 下 图 所 
WERT 个 电子 管 . 如 果 电 子 管 运行 的 概率 分 别 
X p, =0. 80, p, =0. 90, pe =0. 85, pp =0.85, Pe = 
0.75, py 20.75, pç =0.95, 求 系统 的 可 靠 性 . 


ic Tr 

















17.85 w-»Xw mm. 两 个 串联 的 电阻 器 的 失效 时 间 
都 有 均值 为 B= 1 000 h 的 指数 分 布 ， 这 个 系统 在 
t=1 400 h 的 可 靠 性 是 多 少 ? 

17.36 ”并联 元 件 . 4 个 元 件 A、B、C、D 以 并 联 连 
接 . 假设 元 件 A M B 的 失效 时 间 服 从 参数 
4. 2500 h, og =100 h 的 正 态 分 布 , 元 件 C 和 DD 的 失 
效 时 间 服 从 参数 a = 0. 5, B = 100 的 威 布 尔 分 布 ， 


710 





求 系统 在 1=300 h 的 可 靠 性 . 

17.37 半导体 的 寿命 试验 . 半导体 的 服务 寿命 (h) 
有 近似 指数 失效 时 间 分 布 . 投入 10 个 半导体 进行 
寿命 试验 , 直到 4 个 失效 为 止 , 这 4 个 半导体 的 失 
效 时 间 分 别 是 585, 972, 1 460 和 2 266 h. 

a. 构造 半导体 直到 失效 的 平均 时 间 有 的 95% 的 置 
信 区 间 . 

b. 半导体 在 4 000 h 之 后 仍 运行 的 概率 是 多 少 ? R 
这 个 概率 的 95% 置信 区 间 . 

c. 计算 并 解释 半导体 的 危险 率 , 构造 危险 率 的 
95% 置信 区 间 . 

17.88 导弹 制导 的 失效 , 导弹 制导 系统 中 电子 元 件 
的 失效 时 间 (h) 服 从 未 知 参 数 为 a 和 8 的 威 布尔 分 
fu. 为 了 得 到 这 些 参数 的 估计 值 , 投入 1 000 个 元 
件 进 行 寿命 试验 , 每 隔 50 h 记录 仍 在 送行 的 元 件 
个 数 , 数据 如 下 表 所 示 . 

小 时 50 100 


运行 数 611 362 231 136 84 53 17 
——  — ~ 


a. OR a FIL B 的 估计 值 ， 如 果 可 以 使 用 回归 计算 
包 , R a AB 的 99% 置 信 区 间 . 

b. 计算 电子 元 件 在 :=200 h 的 可 靠 性 . 

e. 求 1=50, 100, 150,… 时 的 危险 率 并 作 图 . 
17.39 系统 的 可 靠 性 . 考虑 下 图 所 示 的 产品 系统 ， 

已 知 每 个 元 件 的 可 靠 性 分 别 是 pa = 0. 85, pp = 

0.75, pc 20.75, py 20.90, ps 20.95, 求 整个 系统 

的 可 靠 性 . 


150 200 250 300 350 








理论 补充 练习 
17.40 WHR: 危险 率 z(t) 可 以 表示 成 
_ - d(InR(1)] 
a(t) d — 
(提示 : 利用 事实 R(2) =1 -F(t), 所 以 
f) =U dmn 
然后 把 这 些 表 达 式 代 人 定义 17.5 给 出 的 公式 
中 . ) 
17.41 利用 练习 17. 40 的 结果 及 关系 式 SC) -z(0 
ROWE: 失效 时 间 密 度 可 以 表示 成 


fa) = z(t)e [e 
(提示 : 微分 方程 
z(t) = LRC 


有 如 下 解 : 
R(t) = Duo 
17.42 ”假定 我 们 只 关心 元 件 的 初始 失效 ， 即 一 旦 元 
件 的 生存 超过 了 某 个 时 间 =a, 我 们 就 把 这 个 元 
件 (为 了 所 有 的 实际 目的 ) 看 作 永 不 失效 , 在 这 种 


情况 下 利用 以 下 危险 率 是 合理 的 
_ [B(1 - t/a) 0«t«a 
1 ={0 其 他 


a. 利用 练习 17.41 中 的 结果 , RAG), FO), RG) 
的 表达 式 . 

b. 证 明 : 初始 失效 的 概率 ,， 即 元 件 在 = o 之 前 失 
效 的 概率 是 1 - e "2. 


活动 中 的 统计 学 : 建立 钢筋 混凝土 桥 面 恶化 的 危险 率 模型 

由 在 17. 3 节 中 的 讨论 ， 失效 时 间 分 布 危险 率 的 有 关 知 识 可 以 帮助 我 们 选择 合适 的 失效 时 间 密 
度 函数 , 反之 亦 然 . 然而 , 某 些 失 效 时 间 分 布 是 动态 变化 的 ， 个 可 能 服从 事先 指定 的 概率 密度 函数 , 
例如 ,钢筋 混凝土 桥 面 的 恶化 是 一 个 连续 、 渐 进 、 相对 较 慢 的 过 程 , 这 个 过 程 随 着 一 些 因素 , 例如 交 
通 负荷 、 桥 面 的 当前 结构 条 件 、 桥 的 设计 、 环境 因素 和 材料 性 质 而 变化 , 这 些 桥 面 的 失效 时 间 分 布 不 


能 用 单个 的 已 知 概率 分 布 精确 地 近似 ， 


在 Journal of Infrastructure Systems(2001 4E 6 H ) rp, 加 利 福 尼 亚 大 学 伯克利 分 校 的 土木 和 环境 
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工程 师 为 印 地 安 那 州 的 钢 盘 混 凝 土 桥 面 的 恶化 时 间 分 布 提出 了 一 个 概率 模型 . 他 们 的 目标 是 预测 
桥 面 在 给 定时 间 遭 受 一 次 条 件 — 状态 显著 改变 (恶化 ) 的 概率 . 利用 印 地 安 那 桥梁 详细 目录 (IBI) 
数据 库 中 的 混凝土 桥梁 特征 的 数据 ， 人 研究员 们 拟 合 一 个 模型 ,这 个 模型 是 参数 模型 (此 时 基础 危 
险 率 限制 为 一 个 指定 的 概率 密度 函数 ) 和 非 参 数 模 型 (虽然 是 灵活 的 ， 但 是 不 能 直接 把 恶化 时 间 
和 相应 的 解释 因素 联系 起 来 ) 的 混合 ， 这 种 方法 称 为 半 参 数 回归 模型 ， 容许 危险 函数 可 由 有 效 的 
数据 唯一 的 确定 . 

最 常用 的 半 参 数 回归 模型 是 柯 克 斯 比例 危险 模型 ， 模型 中 所 用 的 危险 函数 h(i1) 表示 为 
如 下 : 

h(t) =Ao(t) ' exp{Bix1 t Bax; * +Bixi | 

其 中 Ao( 世 是 由 数据 得 到 的 经 验 基 准 危险 函数 ， Xy, 22. 7, Xy 是 解释 自 变量 . 根据 研究 者 的 说 法 ,这 
个 “危险 函数 量化 了 桥 面 在 时 刻 i 遭受 一 次 [ 恶化 ] 的 瞬时 风险 ” 柯 克 斯 回归 方法 通过 求 h(i) 似 然 函 
数 自然 对 数 的 最 大 值得 到 参数 8 的 估计 

分 析 中 使 用 的 解释 变量 来 自 IBI 数据 库 ， 列 于 表 SIA17.1 中 . 为 以 下 三 种 状态 中 的 每 一 种 桥 面 
建立 一 个 模型 : 6( 中 等 ) 、7( 尚好) 、 8( 好 ). 所 有 模型 中 的 因 变量 是 与 当前 条 件 下 降 到 更 差 的 桥 
面 恶 化 条 件 关联 的 危险 . 柯 克 斯 比例 危险 回归 在 统计 上 显著 的 (@ =0.01) 参数 估计 值 如 表 
SIA17. 2 所 示 . 


表 SIA17. 1 用 于 柯 克 斯 危险 模型 中 的 IBI 桥 面 变量 





变 BE 名 ” 描述 
TYPECONT 桥 面 结构 类 型 (1 = 连续 , 0 = 其他) 
PRESTRES 桥 面 预 应 力 混凝土 (1 = 真 , 0 = fB) 
REGION 气候 地 区 (1 = 北方 , 0 = 南方 ) 


公路 系统 的 分 类 (1 = 州 际 /乡村 , 2 = 州 际 /城市 ,3 = 其 他 /乡村 , 4 = 其 他 /城市 , 5 = 次 干道 / 








HWCLASS 乡村 ,6 = 次 干道 /城市 , 7 = 次 干道 /地 方 ) 

NUMSPANS 主要 单元 的 桥 孔 数 

LANEDIR 每 个 方向 的 车 道 数 

ADT 平均 日 交通 量 ( 车 辆 数 ) 

ADTYR ` ADT 记 数 的 年 

AVGADT 所 有 的 年 ADT 记 数 的 平均 ADT 

PROTSYS : 磨损 表面 代码 保护 系统 (1 = 真 , 0 = 假 ) 

DECKWID 桥 面 的 宽度 (十 分 之 一 英尺 ) 

STATE 桥 面 亚 化 条 件 等 级 (9 = 新 , 8 = 好 , 7 = 较 好 , 6 = 中 等 , 5 = 较 差 , 4 = YR 3-225, 2 = 临界 / 
需要 修理 ,，! = 临界 /关闭 , 0 = 临界 /超出 修理 ) 

DROP 最 近 一 次 检查 后 下 降 的 恶化 条 件 等 级 数 

AGE 桥 面 年 龄 (年 ) 

TIS 桥 面 处 于 所 述 状态 条 件 的 时 间 ( 年 ) 

RCENSOR 右 删 失 数据 (1 = 真 , 0= 假 ) 


SECONDARY 次 干道 上 的 桥 (1 = 真 , 0 = (BD) 
CO 
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表 SIA17.2 三 种 桥 面 条 件 的 危险 率 模型 参数 估计 值 











状态 =6( 中 等 ) 状态 =7( 尚 好 ) 状态 =8( 好 ) 
REGION 0.85 0.80 0.81 
DECKWID — — - 0. 0036 
NUMSPANS — 0.11 — 
PROTSYS — -0.14 — 
PRESTRES — — 1.19 
TYPECONT — - 0. 46 — 
AGE — — -0.52 
AVGADT 0. 000 04 — — 
AGE x AVGADT — — 0. 000 02 
SECONDARY 0. 84 -0.55 -0. 82 


为 了 解释 虚拟 变量 的 参数 估计 , 首先 计算 估计 量 eB 的 反对 数 . 例如 , 对 于 桥 面 条 件 6, 虚拟 
变量 REGION 估计 量 的 反对 数 是 ee” =2. 34. 这 个 值 表示 北部 桥 面 (REGION = 1) 估计 的 危险 
和 南部 桥 面 (RECION =0) 估计 的 危险 的 比 . 所 以 对 于 条 件 6, 模型 估计 了 北部 印 地 安 那 地 区 的 
桥 面 的 危险 率 比 南部 地 区 桥 面 的 危险 率 高 两 倍 多 . 研究 者 解释 , 这 种 差别 是 由 于 为 了 除去 北部 
路 面 上 的 结 冰 , 盐 和 沙 的 过 量 使 用 , 而 南部 很 少 使 用 除 冰 盐 . 类 似 地 , 虚拟 变量 SECONDARY 
估计 值 的 反对 数 是 e* ”=2. 32. 所 以 , 次 干道 上 桥梁 (SECONDARY = 1) 的 危险 率 是 主干 道上 
桥梁 的 2 倍 多 .〈 按 工程 师 的 说 法 , 这 个 结果 是 由 于 次 干道 桥梁 的 较 低 的 设计 或 保养 标准 . ) 

对 定量 解释 变量 的 参数 估计 , 计算 估计 值 的 反对 数 , 再 减 1, 然后 乘 100. 这 个 结果 表示 定量 变 
量 每 增加 一 个 单位 , 危险 率 的 百分数 的 变化 . 例如 , 对 桥 面条 件 6, 平均 日 交通 量 的 均值 ( AVGADT) 
的 B 佑 计 值 为 0. 000 04, 所 以 , 计算 (es ”% _ 1) «100 =0. 004. 这 样 日 交通 量 每 增加 1 辆 车 , 桥 面 
的 危险 率 增加 0. 004%. 类 似 地 , 对 桥 面条 件 7，,NUMSPANS 增加 1 孔 意 味 着 估计 的 危险 率 增 量 为 
(e* 11 -1) *100=11.6%. 与 柯 克 斯 回归 模型 参数 一 样 的 推断 , 让 工程 师 看 到 影响 钢筋 混凝土 桥梁 
危险 率 的 因素 . 

研究 人 员 给 出 了 预测 的 危险 率 随时 间 变 化 的 图 形 , 对 桥 面条 件 6, 发 现 有 近似 线性 的 增长 趋势 ， 
但 对 条 件 7 和 8 的 桥梁 总 是 平坦 (不 变 ) 的 趋势 , 这 启发 条 件 7 和 8, 恶化 时 间 可 能 是 “无 记忆 的 ”, R 
可 表示 为 指数 分 布 . 
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A. 1 Z$BEERIAB REESE TA 


对 一 些 统计 过 程 ( 如 多 元 回归 ) , 用 矩阵 代数 代替 普通 代数 更 容易 给 出 进行 分 析 的 公式 . 把 数据 
整理 成 特殊 的 矩形 模式 ( 称 为 矩阵 ), 对 它们 实行 各 种 变换 , 能 更 快 地 得 到 分 析 结果 . 在 本 附录 中 , 我 
们 将 定义 矩阵 并 解释 能 对 和 矩阵 实施 的 各 种 运算 . (在 11. 4 节 解释 了 如 何 用 这 个 信息 进行 回归 分 析 . ) 

这 里 给 出 三 个 矩阵 4, B RI C. 注意 每 个 矩阵 都 是 数 的 矩形 排列 , 在 每 一 个 行 - 列 位 置 有 -个 数 


2 3 3 0 1 1 
a- 0 ] ZE 0 ] e: 
-1 6 4 2 Q0. 1 


定义 A. 1 SBREGE CAS — 453235). 

”出 现在 矩阵 中 的 数 称 为 矩阵 的 元 素 . 如 果 一 个 矩阵 包含 r 行 和 < 列 ， 在 矩阵 的 每 一 个 行 - 列 位 置 
都 有 一 个 元 素 , EERE rxe 个 元 素 . 例如 , 如 上 所 示 的 矩阵 4 包含 r=3 行 ,c=2 列 ,有 rxc=(3) 
(2) =6 个 元 素 , 在 6 个 行 - 列 的 每 个 位 置 有 一 个 元 素 . 

定义 A.2 在 某 个 行 - 列 位 置 上 的 数 称 为 矩阵 的 元 素 . 

注意 , EEA, B 和 C 包含 不 同 的 行 数 和 列 数 . 行 数 和 列 数 给 出 矩阵 的 维 数 . 

定义 A.3 一 个 包含 r 行 、c 列 的 矩阵 称 为 rxe 和 矩阵， 其 中 > 和 < 是 抢 阵 的 维 数 . 

定义 A.4 deX r-c, W48 3k 4529 HE. 

当 用 矩阵 记号 给 出 一 个 公式 时 , 用 符号 表示 和 矩阵 的 元 素 . 例如 ， 如 果 有 一 个 矩阵 

- m 815 ,| 
021 G2 Go23 

符号 gj 表示 和 矩阵 第 i 行 、 第 j 列 的 元 素 . 第 一 个 下 标识 别 元 素 所 在 的 行 , 第 二 个 识别 元 素 所 在 的 列 . 
例如 ,元素 oz 在 矩阵 4 的 第 一 行 、 第 二 列 . 行 总 是 从 上 往 下 数 ， 列 总 是 从 左 往 右 数 . ` 

通常 用 大 写字 母 ( 如 4, B, C) 一 一 相应 于 普通 代数 中 所 用 字母 表 中 的 字母 表示 和 矩阵， 不 同 的 
是 , 在 普通 代数 中 , 一 个 字母 用 来 表示 单个 实数 ， 而 在 矩阵 代数 中 , 一 个 字母 表示 一 个 数 的 矩形 排 
列 . 矩阵 代数 的 运算 和 普通 代数 很 相似 一 一 可 以 进行 矩阵 的 加 、 减 、 乘 等 运算 . 然而 有 些 运算 是 矩阵 
特有 的 , 如 和 矩阵 的 转 置 . 例如 , 若 





5 1 

1 1 

A=| 0 B=|1 
4 1 

1 


Q D + — O 


2 
那么 矩阵 A # B HF RER (IREE A'A B’) 是 


O 为 了 我 们 的 目的 , 假定 这 些 数 都 是 实数 . 
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l 1111 
A'=[5 1042] 和 B=[ | ¿4 2 al 


定义 A5 和 矩阵 4 的 转 置 ( 记 作 A') 是 交换 矩阵 和 0038 9 4146542265 , Fp ZE £ A $05 ¿ 44 EX, 
AE FE A! 65 55 i P1. 

由 于 我 们 主要 关心 矩阵 代数 在 多 重 回归 中 最 小 二 乘 方程 的 解 的 应 用 ( 见 第 11 3€) ,因此 只 定义 
和 此 问题 有 关 的 矩阵 的 运算 和 类 型 . 

对 我 们 来 说 最 重要 的 运算 是 要 求 行 - 列 相 乘 的 矩阵 乘法 ,为 说 明 这 个 过 程 , 假定 我 们 想 求 乘积 
AB, 其 中 
2 1 203 
4 1] 和 B=| -1 4 0 
我 们 总 是 用 4( 左 边 矩 阵 ) HITRA B( 右边 矩阵 ) 的 列 . 由 于 4 的 第 一 行 和 8B 的 第 一 列 形成 的 积 是 由 
相应 位 置 上 的 元 素 相 乘 ， 再 把 这 些 乘 积 相 加 而 得 , 因此 , 第 一 行 和 第 一 列 的 积 如 下 图 所 示 

(2)(2)+(1)(-1) =4-1=3 


2 8r.» 0 3 3 
h a3 4 all | 
类 似 地 , 第 一 行 、 第 二 列 乘积 是 
(2)(0) +(1)(4) 2044-4 


4 


至 此 , 我 们 有 
AB-[? 4] 
为 了 求 完整 的 矩阵 乘积 AB, RERE AB 矩阵 中 的 每 一 个 元 素 . 所 以 , 定义 AB 的 第 i 行 、 第 j 
列 元 素 是 4 的 第 i 行 和 B 的 第 j 列 的 乘积 . 我 们 在 例 A. 1 中 完成 这 个 过 程 . 


REBAB, Hop: 
2 0 3 
-1 4 0 


- B €12 ,| 
€ C22 C23 
我 们 已 经 求 出 e =3, co =4. 类 似 地 , AB 的 第 二 行 第 一 列 元 素 ca 是 4 的 第 二 行 和 B 的 第 一 列 
的 乘积 : 


4=[ ues 


解 ”如果 把 乘积 4B 表示 成 


(4)(2) +( -1)( -1) 584129 
用 类 似 的 方法 继续 求 AB 的 其 他 元 素 , 得 
2 lp 203) 3 4 6 
7 AB=[, All 4 ol =l -4 il 
现在 , 用 例 A. 1 中 的 矩阵 4 TU B 试 求 乘积 BA. 你 会 发 现 矩 阵 代 数 的 乘法 和 普通 代数 的 乘法 之 
间 有 两 个 重要 的 不 同 : 


1. 不 可 能 求 出 乘积 BA, 因为 不 能 执行 行 - 列 相 乘 . 把 矩阵 放 在 一 起 , 我 们 会 看 到 它们 的 维 数 不 
匹配 . 


#E 阵 代数 
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BA 不 存在 





BEWE) 中 一 行 的 元 素 个 数 (3 ) 不 能 和 4 (右边 的 矩阵 ) 中 一 列 的 元 素 个 数 (2) 相 匹 配 . 
因此 , 不 能 执行 行 - PUR , 所 以 矩阵 乘积 BA 不 存在 . 即 并 不 是 所 有 甜 阵 都 能 相 乘 . 只 有 当 


4 是 "xd 且 妃 是 4xec 时 才能 求 矩阵 AB 的 积 . 也 就 是 说 ， 两 个 内 维 数 必须 相等 , 乘积 的 维 数 
总 是 由 外 维 数 给 定 . ( 见 下 面 框 格 . ) 














2. 普通 乘法 和 矩阵 乘法 的 第 二 个 不 同 是 ， 在 普通 代数 中 , ab = ba, 而 在 矩阵 代数 中 ,AB 通常 不 
等 于 BA. 实际 上 , 如 上 面 第 1 项 提 到 的 , 它 其 至 可 能 不 存在 . 
定义 A.6 一 个 rxd EB A 和 一 个 d xc 3 B 的 乘积 AB 是 一 个 rxc EEC, X C 的 元 素 
Cy(i=1,…,7) 是 4 的 第 i 行 和 B 的 第 j 列 的 来 积 . 
已 知 下 面 的 矩阵 , RIA 和 IB. 


2 3 0 100 
s] zl 2 | Ë 1 j 
3 4 1 0 


_ 0 1 
R ”注意 到 乘积 
IA 
Zs 
3x3 3x1 
AA 


存在 并 且 它 将 是 3 x 1 BE; 
- [1 0 0T2] r2 
n-o 1 TBI 
0 0 1JL3J L3 
类 似 地 ， 


存在 并 母 是 3 x2 #E; 
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1 0 0-r3 0 3 0 
m-[o 1 of: :|-|， | 
0 0 1J4 -1d L4 -1 
注意 矩阵 了 具有 一 个 特殊 的 性 质 . 有 IA = A 和 1B = B. 我 们 将 在 A. 2 节 进一步 讨论 这 个 性 质 . 
Os Ct 
a 乘积 BC 的 2? 
A.1 SEERA, BAC: ! 105 b. CB 的 维 数 是 多 少 ? 
4-| s= [° 4] c-[ c. AIR B A C 是 练习 A. 2 中 所 示 和 矩阵 , sk CB. 


-i 4 -2 1 2 
" TUS. ,B H 
a. SK AB. b. SK AC. c. R BA. A5 考虑 矩阵 和 和 C 




















100 2 3 
A2 BEERA, BMC: 3 4=|030|B8=-|-3 0 | c=[3 0 2] 
002 4 -1 
A= b N | PSU 0 2] e=fo] a. RAB. b. RCA. c RCB. 
a. 求 4C. A.6 考虑 矩阵 ; 
b. sË BC. I 
c， 可 能 求 出 AB 吗 ? 说 明理 由 . A=[3 0 -1 2] B= o 
A.3 假定 4 是 一 个 3 x2 和 矩阵 ,下 是 2x4 和 矩阵 . 
a. AB 的 维 数 是 多 少 ? 3 


b， 可 能 求 出 乘积 AB 吗 ? 说 明理 由 . 2 RAB. b. RBA. 


A.2 Hire ERE PEIUS 


在 普通 代数 中 , 1 是 乘法 运算 的 单位 元 素 ， 即 1 是 这 样 的 元 素 : 它 使 得 其 他 任意 数 ( 如 c) 与 单位 
元 素 相 乘 等 于 所 以 4(1) =4, ( -5) (1) = -5, 等 等 . 
矩阵 代数 中 乘法 的 相应 单位 元 素 (用 符号 了 表示 ) 是 一 个 使 得 对 任意 矩阵 A, 
AI -IA-A 
的 矩阵 普通 代数 和 矩阵 代数 的 单位 元 素 之 间 的 不 同 在 于 , 在 普通 代数 中 , 只 有 一 个 单位 元 素 一 一 
L 在 矩阵 代数 中 , 单位 矩阵 必须 有 使 积 IA 存在 的 正确 的 维 数 . 从 而 存在 无 穷 多 个 单位 矩阵 -全 是 
方 阵 并 且 都 有 相同 的 形式 . 1 x1, 2 x2 和 3 x3 的 单位 阵 是 ; 


1 0 O 
4o used uso n o| 
0 0 1 
在 例 A.2 中 , 我 们 证 实 了 这 个 矩阵 满足 性 质 ; 
IA =4 
如 果 4 是 下 面 所 示 和 矩阵 , R IA 和 4 
3 4 -] 
1 0 ,|= 
1 01r3 4 -1 3 4 -1 
ll: 0 Jl 0 j- 


^ 


2xX22x3 
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34 -f L OT 44 4 
Al "li o o 1 o4 $ j^ 
ZN 0 0 1 
2x33x3 


注意 ,用 于 求 乘积 14 和 47 的 单位 矩阵 的 维 数 是 不 同 的 . 为 使 乘积 存在 ,这 是 必要 的 . 
定义 A.7 ikA X 4E AERE, 如 果 4T=14 =A, 那么 矩阵 I 定义 为 单位 矩阵 . 满足 这 个 定义 的 甜 
阵 有 如 下 形式 : 


1 0 0 Uc 0 
0 1 O Ut 0 
7=|0 0 1 Urs 0 
0 0 0 Urs 1 


当 考虑 除法 过 程 及 其 在 方程 解 中 的 角色 时 , 单位 元 素 是 重要 的 . 在 普通 代数 学 中 , 除法 实质 上 
就 是 用 元 素 的 倒数 相 乘 ， 例 如 , 方程 
2X =6 


可 以 在 方程 两 边 除 以 2 解 出 ,或 者 在 方程 两 边 乘 以 十 ， 即 2 的 个 数 解 出 . 所 以 


(zpxeio 
X-3 
一 个 元 素 的 倒数 是 什么 ? 它 是 使 得 倒数 乘 以 这 个 元 素 等 于 单位 元 素 的 元 素 . 所 以 , 3 的 倒数 是 
1/3, 因为 


在 矩阵 代数 中 , 单位 矩阵 有 相同 的 作用 . 因此 ， 一 个 矩阵 A 的 倒数 ( 称 作 4 的 逆 , 并 用 符号 4-1 
表示 ) 是 一 个 使 得 44 -1 =4 -14 =7 的 矩阵 ， 

逆 仅 对 方 阵 有 定义 , 但 并 不 是 所 有 的 方 阵 都 有 首 . (在 解 最 小 二 乘 方程 和 回归 分 析 的 其 他 问题 中 , 的 确 
有 重要 的 作用 . ) 我 们 将 在 A.3 35 给 出 逆 矩 阵 的 一 个 重要 应 用 . 求 一 个 矩阵 的 逆 的 过 程 将 在 A.4 节 说 明 . 

定义 A.8 方 阵 4-1 称 作 方 阵 和 的 道 , 如 果 

A-14=A4-1=J 

求 逆 矩阵 的 过 程 在 计算 上 是 相当 烦琐 的 ， 通常 用 计算 机 执行 . 也 有 一 个 例外 ， 求 一 类 称 作对 角 
矩阵 的 逆 和 矩阵 是 容易 的 . 对 角 矩 阵 是 在 主 对 角 线 上 (从 和 矩阵 的 左上 角 到 右 下 角 ) 有 非 0 元素, 其 他 都 
是 0 元 素 的 矩阵 . 例如 ， 单位 矩阵 是 一 个 对 角 抢 阵 ( 主 对 角 线 都 是 1) ， 下 面 的 矩阵 也 是 对 角 阵 : 


0 0 0 
3 0 0 

0 2 0 0 
4=|0 1 0| B= 

0 0 1 0 

0005 


定义 A 9 对 角 矩 阵 是 主 对 角 线 上 的 元 素 非 0， 其 他 位 置 上 的 元 素 都 为 0 的 矩阵 . 
可 以 验证 : 
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1 
— 0 
3 0 O 3 9 
safo 1 ] B) A-C'-|O 1 0 
002 1 
0 075 
BAA! = I. 对 角 和 矩阵 的 逆 由 定理 A. 1 给 出 . 
定理 A.1 sñ EF 
di 0 0 e 0 l/d 0 0 0 
0 dz 0 0 1⁄d,, 0 
D-|0 0 d, 0 | 的 逆 是 D-!=| 0 0 1/dy 
0 0 0 dyn 0 0 0 1/d,, 
(D) 练习 " 
A7 考虑 下 面 的 矩阵 . un 
-一 0 — 
4-[ 3 0 ?] n 4 
-1 1 4 1 
a. 给 出 用 来 求 乘积 IA 的 单位 矩阵 . 0 2 0 
b. 证 明 JA = A. A = 
c. 给 出 用 来 求 乘积 47 的 单位 矩阵 . 0 0 0 
d. 证 明 47=4. l o 3 
A.B ”对 给 出 的 矩阵 和 4 和 8B, 证 明 : AB = 和 BA =I, 4 Š 
因此 验证 B=A4-. A.10 如果 
1 0 0 + 0 0 
199 0 L Ó 3 0 0 
0 0 3 1 0 0 7 
0 0 — 1 
0 0 — 
A9 如 果 


A.11 验证 定理 A.1. 


° 

Š 
© œ o o 
oo c O œ 


A.3 解 线性 联 立 方程 组 
考虑 下 面 有 两 个 未 知 数 的 线性 联 立方 程 组 : 


2v; +v =7 " 


vı -n =2 
注意 ,这 些 方程 的 解 是 v1 =3, v, =1. 
现在 定义 矩阵 ; 


4E HEX & 719 


2 1 Vi 7 

4-|, al vef] c=[,] 
所 以 , A 是 和 vw 的 系数 矩阵 , V Je G1 K RIBRKA02I3EEE( KOK E4E F32) , G 是 包含 等 号 右边 数 
字 的 列 和 矩阵 . 

现在 上 面 给 出 的 联 立方 程 组 可 以 重新 写成 矩阵 方程 ; 
AV-G 

用 一 个 矩阵 等 式 表示 的 是 乘积 矩阵 AV 等 于 矩阵 G. 矩阵 相等 意味 着 对 应 的 元 素 相等 . 可 见 表达 式 
AV=G 是 成 立 的 ,因为 





2 la% (2v, +03) 
A L ahlie | G 
2xX22Xx1 2x1 
将 有 两 个 未 知 数 的 两 个 联 立 线性 方程 组 表示 为 矩阵 过 程 可 以 推广 到 有 上 个 未 知 数 的 个 联 立 线 
性 方程 组 的 情形 . 如 果 方 程 组 写成 通常 的 形式 : 
9j; Tau) 二 十 QUO = gi 


CQ2171 + 02222 t + a5 v, = 82 


Gk 7j 十 GjyV, tin Fav; = gy 


那么 线性 联 立 方程 组 可 以 表示 成 矩阵 方程 4Y= G, 其 中 


94 Gp '" dj Ui &1 

021 a» v2 g2 
A= yz G 

akl UU Akk Vh Ek 


现在 解 这 个 联 立 方程 组 (如 果 它 们 有 唯一 解 , 可 以 证 明 A FE ) TERES PETERS PARE DEA -1 
我 们 有 
(A-l)AV=(A-1)G 
但 是 由 于 44 7! =I, 我 们 有 
(DVzA-!G 

V-A-!G 
换 句 话说 ,如 果 已 知 4 I, 就 可 以 通过 求 乘积 4 -1G 得 到 这 个 线性 联 立方 程 组 的 解 ， 即 

V=A-1G 
利用 上 面 的 结果 求 线性 联 立 方程 组 的 解 ; 

2v +n =7 


21 -0 =2 
1 一 02 


^-[ a 


解 ”第 一 步 是 获得 系数 矩阵 


Bi, Bi 
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1 1 

Au 3 3 
|i 2 
3 3 





(这 个 矩阵 可 用 求 逆 和 矩阵 的 计算 机 程序 包 来 求 , 或 者 对 这 种 简单 情况 , 可 用 AL 4 节 给 出 的 步骤 求 .) 
当 检查 时 , 注意 


2 1 /1 0 
A 4= p allo 1]=7 





1 
3 
1 
3 





第 二 步 是 得 到 乘积 4-1G, 所 以 
1 1 
3 317 r3 
| ip 
3 3 
由 于 


"1-5 


因此 =3, v, - 1. 可 见 v 和 vw 的 值 满足 线性 联 立方 程 组 ， 并 且 是 本 节 开 始 指出 的 解 的 值 . 


练习 A.13 ”对 如 下 线性 联 立 方程 组 : 
A. 12 ”假定 线性 联 立方 程 组 10v, +20v, -60 =0 
3v, +o, =5 20v, -60 =0 
| y =3 20v, * 68v, — 176 =0 
表示 成 如 下 矩阵 方程 : a. RERA, VÄG. 
AV =G b. 验证 ， 
17 1 
CAA VAG I ood 
B E 1 
| + + A'= 0 oa 
A'- 1 1 
B H ua 9 gg 
. 3j V-A'!G, £g. 
(注意 : 求 4 的 方法 在 A.4 节 给 出 ). e. RR 解 此 方程 组 


e. HEBR V=A G, 解 此 方程 . 


A.4 求 道 矩阵 的 方法 


有 几 种 不 同 的 求 逆 矩阵 方法 ， 所 有 方法 都 是 宛 长 且 费 时 的 . 所 以 , 实际 上 ， 几乎 所 有 的 矩阵 都 是 
用 计算 机 求 逆 的 . 本 节 的 目的 是 介绍 一 种 方法 , 使 得 你 会 手 算 求 较 小 (2 X2 或 3 x3)BEEBUSE, 并 领 
会 在 大 和 矩阵 求 逆 中 ( 因此 在 包含 许多 项 的 线性 模型 拟 合 数据 集 时 ) 庞大 的 计算 问题 . 尤其 是 你 能 理解 
为 什么 会 入 误差 会 潜入 求 逆 过 程 ， 因此 理解 为 什么 两 个 不 同 的 计算 机 程序 对 同一 和 矩阵 求 逆 可 能 给 出 
相应 元 素 稍 有 不 同 的 逆 和 矩阵 . 


#E BE 4X, d 721 





我 们 将 要 演示 和 矩阵 4 的 求 逆 过 程 ,要求 对 矩阵 4 的 行 实行 一 系列 的 运算 . 例如 , 假定 


1 -2 
A- [ -2 s| 
RITHE HB REI Fel O2 S XE TAB PEU 438 EO , 
1. 可 以 用 常数 乘 以 某 一 行 的 每 一 个 元 素 . 例如 ,可 以 对 和 矩阵 4 的 第 一 行进 行 运算 , 用 一 常数 
(如 2) 乘 以 该 行 的 每 个 元 素 , 那么 得 到 的 行 是 [2  -4]. 
2. 可 以 用 常数 乘 以 矩阵 的 另 一 行 , 然后 把 那 一 行 的 元 素 加 (或 减 ) 到 运算 行 的 相应 位 置 元 素 的 
行 运算 . 例如 , 对 和 矩阵 4 的 第 一 行进 行 这 样 的 运算 , 用 一 常数 (如 2) 乘 以 第 二 行 : 
2[ -2 6]=[-4 12] 
然后 把 这 行 加 到 第 一 行 : 
[(1-4)( -2+12)] =[ -3 10] 
注意 重要 的 一 点 . 我 们 是 对 和 矩阵 4 的 第 一 行进 行 运算 , 虽然 利用 矩阵 的 第 二 行 执行 这 个 运算 ， 
但 第 二 行 保持 不 变 . 所 以 , 我 们 刚刚 描绘 的 对 和 矩阵 4 的 行 运算 将 产生 新 的 矩阵 ， 
-3 10 
[ gl 
利用 行 运算 求 逆 和 矩阵 是 基于 和 矩阵 代数 的 初等 结果 . 可 以 证 明 ( 证 明 略 ) 在 矩阵 4 实施 一 系列 的 行 
运算 等 价 于 用 一 个 矩阵 瑟 乘 以 矩阵 4, 即行 运算 产生 一 个 新 矩阵 BA. 利用 这 个 结果 如 下 : 将 矩阵 4 
和 一 个 相同 维 数 的 单位 矩阵 了 放 在 一 起 . 然后 对 4 和 工 实行 同样 系列 的 行 运算 ,直到 和 矩阵 4 变换 成 
单位 矩阵 工 这 意味 着 用 某 个 矩阵 召 乘 以 矩阵 4 和 了 ,使 得 
] DEED 
0 


A= I= 


c= o 


| — 行 运算 将 4 变换 成 / — | 


- 
lI 
[>] 
li 











L ] L 
BA =I H BI=B 
由 于 BA =I, MUA B 2A 71. 因此 , 随 着 矩阵 4 由 于 行 运算 变换 成 单位 矩阵 7 单位 矩阵 7 了 也 变 
换 成 了 A -!， 即 
BI=B=A-! 
将 用 两 个 例子 来 说 明 这 个 过 程 . 
R FE RER 





O ”省略 了 第 三 种 行 运算 , 因为 它 没有 增加 什么 并 且 可 能 引起 混乱 . 
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1 -2 
-2 A 
解 把 矩阵 4 和 一 个 2 x2 单位 矩阵 放 在 一 起 ， 然后 执行 下 面 一 系列 的 行 运算 (用 箭头 标示 每 次 


运算 中 的 运算 行 ) : 


1 -2 1 0 
^a gd rns i] 
运算 1 用 2 乘 以 第 一 行 并 加 到 第 二 行 上 去 : 
1 -2 1 0 
lo 2 2 || 
i8" HI/255—45.: 
| | _2 1 O 
40 pi 


运算 3 用 2 乘 以 第 二 行 并 加 到 第 行 上 去 ， 


从 而 


求 逆 的 最 后 一 步 是 求 乘积 4 -14， 检查 解 是 否 等 于 单位 矩阵 工 检查 
aP Ipa -a ao 
4 A=j 1 | 2 j=[ 
> _ 6 0 1 


由 于 乘积 等 于 单位 矩阵 , 说 明 解 4-! 是 正确 的 
求 矩阵 4 的 逆 . 


解 ” 把 单位 矩阵 放 在 矩阵 4 的 旁边 并 执行 行 运算 ， 
运算 1 H RUT: 


3 1 
>10 35 2 0 0 
0 4 1 0 1 O 

3 1 2 0 


运算 2 用 3 乘 以 第 一 行 并 从 第 三 行 减 去 ， 








4E Ft 4X, d 723 
3 I 
1 O > z 00 
0 4 1 0 1 0 
5 3 
— ~ —— 
0 1 5 > 01 
- l aree — 2 
运算 3 用 才 乘 以 第 二 行 : 
3 1 
1 0 > > 00 
1 1 
— 0 1 4 0 4 0 
5 3 
0 1 - -7 01 
运算 4 第 三 行 减 去 第 二 行 ; 
3 1 
1 0 5 3 0 0 
1 1 
0 1 1 0 19 
11 3 1 
—19 0 ^4 ^2 741 
_ 4 nae 
运算 5 用 -五 乘 以 第 三 行 : 
1 
3 — 0 0 
1 0 > 2 | 
1 0 — 0 
afa 1 
ER i2 1 4 
00 1 22 11 1 
x= — 5 一 ~ /一 1 
运算 6 第 二 行 减 去 第 三 行 的 二-: 
1 
o > 0 0 
2 3 5 10 
l0 1 0 22 22 11 
00 1 12 1 ^ 4 
22 11 11 
é 
- y EE: 
运算 7 第 一 行 减 去 第 三 行 的 5: 
Z 3 6 
~ oo| 2 2 N 
-> ~ — I- -1 
[ o d 22 22 17 |=4 
6 1 4 
11 11 11 


为 检查 解 , 我 们 求 乘积 
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7 3 56 
2 2 n 


2 0 3 1 0 0 
4-14= 3 3 a 4 hr 1 o| 





22 2 1n 
6 1 14 
1l 1 1l 
由 于 乘积 4 -14 等 于 单位 矩阵 , 因此 解 和 4-! 是 正确 的 . 

例 A.5 和 例 A. 6 指出 对 和 矩阵 4 执行 行 运算 将 它 变 成 单位 矩阵 时 使 用 的 策略 . 用 一 个 常数 乘 以 第 
一 行 , 把 顶端 行 左边 的 元 素 变 成 1. 然后 执行 运算 , 把 第 一 列 所 有 元 素 变 成 0. 再 对 第 二 行 执行 运算 ， 
将 第 二 个 对 角 元 素 变 成 1. 然后 执行 运算 , 将 第 二 列 所 有 在 第 二 行 下 方 的 元 素 全 变 成 0. 再 在 第 三 行 
的 对 角 元 素 上 作 运 算 , 等 等 . 当主 对 角 线 上 的 所 有 元 素 都 为 1, 并 且 所 有 主 对 角 线 下 方 的 元 素 都 是 0 
时 , 执行 行 运算 , 把 最 后 一 列 变 成 0; 然 后 是 倒数 第 二 列 , 等 等 , 直到 回 到 第 一 行 . 这 个 把 非 对 角 元 素 
变 成 0 的 过 程 以 图 的 形式 显示 如 下 : 


y 
asd ^ 











Hifi SIoR —T5BPAE BU ERES BOR — BOX RR PE BU EBLTR KRE, MEMME, 因此 在 计 
算 中 可 能 产生 大 的 舍 入 误差 , 除非 在 计算 中 保留 很 多 位 的 有 效 数字 . 

这 就 解释 了 为 什么 两 个 不 同 的 多 元 回归 分 析 计 算 程序 可 能 对 同一 个 参数 B 得 到 不 同 的 估计 值 ， 
并 且 强 调 当 求 一 个 矩阵 道 时 , 在 所 有 计算 中 保留 很 多 位 有 效 数字 的 重要 性 . 











OEE 
` ` 1 0 1 4 0 10 
A 14 ¿kU FIERE H COE TS US 8 69 3E, 保证 A- 
A^A - AA"! =]; c. =|0 2 1] d. A-| 0 10 0 
30 2 1 1 3 10 0 5 
nafi 2 b 4-|: 4 2| (iE. 这 些 练习 没有 给 出 答案 ,如果 AC A = I, 则 
4 5 5 1 1 答案 是 正确 的 . ) 


附录 B 有 用 的 统计 表 


表 B.1 随机 数 








1 10480 15011 01536 02011 81647 91646 60179 14194 62590 36207 20969 99570 91291 90700 
2 22368 46573 25595 85393 30995 89198 279082 53402 93065 34005 52666 19174 39615 99505 
3 24130 — 48360 22527 97265 776393 64809 151790 24830 49340 32081 36080 19655 63348 58629 
4 42167 93003 06243 61680 07856 16376 390440 53537 71341 57004 00849 74917 97758 16379 
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672 14110 06907 01263 54613 
6 TI921 069007 11008 42751 27756 53498 18602 70650 90655 15053 21916 81825 44394 40880 
7 99562 72905 56420 60994 98872 31016 71194 18738 44013 48840 63213 21069 10634 12952 
8 96301 91977 05463 07972 18876 20922 94505 56869 60014 60045 18425 84903 42508 32307 
9 89579 14342 63661 10281 17453 18108 57740 84378 25331 12566 58678 44947 05585 56941 
10 85475 36857 53342 53988 53060 59533 38867 62300 08158 17983 16439 11458 18593 64952 
11 28918 69578 88231 33276 70997 79936 56865 05859 90106 31595 01547 85590 91610 78188 


16 51085 12765 51821 51259 77452 16308 60756 92144 49442 53900 70060 63990 75601 40719 


17 02368 21382 52404 60268 89368 19885 55322 44819 01188 65255 64835 44919 05044 55157 
18 01011 54092 33362 94904 31273 04146 18594 29852 71585 85000 51132 01915 92747 64951 
19 52162 53916 46369 58586 23216 14513 83149 98736 23495 64350 94738 17752 35156 35749 
20 07056 97628 33787 09998 42608 06691 76088 13602 51851 46104 88916 19500 25625 58104 
21 48663 91245 85828 14346 09172 30168 90229 04734 590193 22178 3042] 61666 99904 32812 
22 54164 58492 22421 74103 47070 25306 76468 26384 58151 06646 21524 15027 6X0 4450 
23 32639 32363 05597 24200 13363 38005 94342 28728 35806 06912 17012 64161 18296 22851 
24 29334 27001 87637 87308 58731 00256 45834 15398 46557 41135 10367 07684 36188 18510 
25 02488 33062 28834 07351 19731 92420 60052 61280 50001 67658 32586 86679 50720 94953 
26 81525 72295 04839 96423 24878 82651 66566 14778 76797 14780 13300 87074 70666 95725 
27 29676 20591 68086 26432 46901 20849 89768 81536 86645 12650 92050 57102 80408 25080 
28 00742 57392 39064 66432 84673 40027 32832 61362 98947 96067 64760 64584 96006 98253 
29 05366 — 04213 25660 26422 44407 44048 37937 63904 45766 66134 75470 66520 34603 90449 
30 91921 26418 64117 94305 26766 25940 39972 22200 71500 64568 91402 42416 07844 69618 
31 00582 — 04711 87917 77341 42206 35126 74087 99547 81817 42607 43808 76655 62028 76630 
32 00725 69884 62797 56170 86324 88072 76222 36086 84637 93161 76038 65855 77919 88006 
33 69011 65795 95876 55293 18988 27354 26575 08625 40801 59920 29841 80150 12777 48501 
3 25976 57948 29888 88604 67917 48708 18912 82271 65424 69774 33611 54260 85063 03547 
35 09763 83473 73577 12908 30883 18317 28290 35797 05908 41688 34952 37888 38917 88050 
36 91576 42595 27958 30134 04024 86385 29880 99730 55536 84855 29080 09250 70656 . 73211 
37 17955 56349 90999 49127 20044 59931  O6115 20542 18059 02008 73708 83517 36103° 42791 
38 46503 18584 18845 49618 00304 51038 20655 58727 28168 15475 56942 53389 20562 87338 





ul 
D 
— 
Ë 
- 
E 
m 
- 
= 


84610 — 82834 — 09922 25417 44137 48413 25555 21246 35509 20468 
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03237 45430 55417 63282 90816 17349 88298 90183 36600 78406 06216 95787 42570 90730 
86591 81482 52667 61582 14972 090053 89534 76086 49199 43716 97548 04379 46370 28672 








100 38534 — 01715 94964 87288 65680 43772 39560 12918 86537 62738 19636 51132 25739 


资料 来 源 : Beyer W. H. (ed), CRC Standard Mathematical Tables, 24th ed. ( Cleveland: The Chemical Rubber Company) , 1976. Re- 
produced by permission of the publisher. 





表 B.2 累积 二 项 概率 
制 表 值 是 Èro) 


a n-5 | 
p 


k 0.01 0.05 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.95 0.99 

0 09510 0738 0590 0 327 0.1681 0.078 0.0313 0.0102 0.0044 0.0003 0.0000 0.0000 0.0000 
1 0990 0.9774 0.9185 0. 7373 0.5282 0.3370 0.1875 O 0870 0.0308 0.0067 0.0005 0.0000 0.0000 
2 1.0000 0.9988 09914 0941 0.8369 0.6826 0.5000 03174 0. 1631 0.0579 0.0086 0.0012 0. 0000 
3 
4 





1.0000 1.0000 0.9995 0.9933 0.9692 0.9130 0.8125 0.6630 0.4718 0.2627 0.0815 0.0026 0.0010 


1.0000 1.0000 1.0000 09997 09976 0.9898 — 0.9587 0.9922 0.8319 0673 0.4005 0.2262 0,0490 
b. n=6 
p 


k 0.01 0.05 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.95 0.90 

0 0945 0751 0514 0.2621 0.1176 0.0467 0.0156 Q0 0041 0007 000 000 0 0000 0.0000 
1 0.9985 0.9672 0.8857 0.6554 0.4202 0.2333 0.104 0040 0 0100 0.0006 000 000 0 0000 
2 1.0000 09978 0981 0.9011 0.7443 0.5443 0.3437 O01792 0.0705 0.0170 0.0013 0.0001 0. 0000 
3 
4 
5 





1.0000 0.9999 0.9987 0.9830 0.9295 0.8208 0.6562 0.4557 0.2557 0.0989 0.0158 0.0022 0.0000 
1.0000 1.0000 0.9999 0.9984 0.9891 0.9590 0.8906 0.7667 0.5798 0.3446 0.1143 0.0328 0.0015 
1.0000 1.0000 1.0000 0.9999 0.9993 0 9959 0.9844 09533 0.8824 0739 0.4686 0.2649 0.0585 
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( 续 ) 
-= 一 

P 
k 0.01 0.05 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.95 0.99 
O 0.9321 0698 0.4783 0.2097 0.0824 0.0280 00778 0.0016 0.0002 0.0000 000 0.0000 0. 0000 
1 0.9980 0.9556 0.8503 0.5767 0.3204 0.1586 0.0625 0.0188 0.0038 0.0004 0.0000 (0.0000 0.0000 
2 1.000 0.9962 0.9743 0.8520 0.647] 0.4199 0.2266 0.0963 0.0288 0.0047 0.0002 0.0000 0.0000 
3 1.0000 0.9998 0.9973 0.9667 0.8740 0.7102 0.5000 0.2808 0.1260 0.0833 0.0027 0.0002 0.0000 
4 1000 1.0000 0.9998 0.9953 0.9712 0.9037 0.7734 0.5801 0.3529 0.1480 0.0257 0.0088 0.0000 
5 1.0000 1.0000 1.0000 0.9996 0.9962 0.9812 0.9375 0.8414 0.6706 0.4233 0.1497 0.0444 0.0020 
6 1.000 1.0000 1.0000 1.0000 0.9998 0.9984 0.9922 0.9720 0.9176 0.7903 0.5217 0.3017 0.0679 
d. n=8 

P 
k 0.01 0.05 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.95 0.99 
0 0927 0.6634 0.4305 0.1678 0.0576 0.0168 0.0039 0.0007 0.0001 0.0000 0.0000 0.0000 0.0000 
1 0.9973 0.9423 0.8131 0.5033 0.2553 0.1064 0.0352 0.0085 0.0013 0.00001 0.0000 0.0000 0.0000 
2 0.9000 0.9942  Á 0.9619 0.7969 0.5518 0.3154 0.1445 0.0498 0.0113 0.0012 0.0000 40.0000 0.0000 
3 1.0000 0.9996 0.9950 0.9437 0.8059 0.5941 0.3633 0.1737 0.0580 0.0104 0.0004 0.0000 0.0000 
4 1.0000 1.0000 0.9996 0.9896 0.9420 0.8263 0.6367 0.4059 0.1941 0.0563 0.0050 0.0004 0.0000 
5 1.0000 1.0000 1.0000 0.9988 0.9887 0.9502 0.8555 0.6346 0.4482 0.2031 0.0881 0.0058 0.0001 
6 1.0000 1.0000 1.0000 0.9999 0.9987 0.9915 0.9648 0.8936 0.7447 0.4967 0.1860 0.0572 0.0027 
7 1.0000 1.0000 1.0000 1.0000 0.9999 0.9993 0.9961 0.9832 0.9424 0.8322 0.5695 0.3366 0.0773 
e nz9 

p 
k 0.01 0.05 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.95 0.99 
0 0915 0.6302 0.3874 0.1342 0.0404 0080 0.0000 003 0.0000 0.0000 0.0000 0.0000 0.0000 
1 0.9966 0.9288 0.7748 0.4362 0.1960 0.0705 0.0195 0.038 0.0004 00000 0.0000 0.0000 0.0000 
2 0.9999 0.9916 0.9470 0.7382 01463 0.2318 0.0898 0.0250 0.0043 0.003 0.0000 0.0000 0.0000 
3 1.0000 0.9994 0.9917 0.9144 0.7297 0.4826 0.2539 0.0004 0.0253 0.0031 0.0000 0.0000 0.0000 
4 1.000 1.0000 0.9991 0.9804 0.9012 0.7334 0.5000 0.2666 0.0988 0.0196 0.0009 0.0000 0.0000 
5 1.0000 1.0000 0.9999 0.9969 0.9747 - 0.9006 0.7461 0.5174 0.2703 0.0856 0.0083 0.0006 0.0000 
6 1.0000 1.0000 1.0000 00.9997 0.9957 0.950 0.9102 0.7682 0.5372 0.2618 0.0530 0.0084 0.0001 
7 1.000 1.0000 1.0000 1.0000 0.9996 0.9962 0.9805 0.9295 0.8040 0.5638 0.22322 0.0712 0.0034 
8 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9980 0.9899 0.9596 0.8658 0.6126 0.3698 0.0865 
f h. =10 

P 
k 0.01 ' 0.05 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.95 0.99 
0 0.9044 0.5987 0.3487 0.1074 0.0282 0.0060 0.0010 0.0001 0.0000 0.0000 0.0000 0000 0.0000 
1 0.9957 0.9139 0.736] 0.3758 0.1493 0.0464 0.0107 0.0017 0.0000 0.0000 0.0000 0.0000 0.0000 
2 0.9999 0.9885 0.9298 0.6778 0.3828 0.1673 0.0547 0.0123 0.0016 0.0000 0.0000 0.0000 0.0000 
3 1.0000 0.9990 0.9872 0.8791 0.6496 0.3823 0.1719 0.0548 0.0106 0.0009 0.0000 0.0000 0.0000 
4 1.0000 0.9999 0.9984 0.9672 0.8497 0.6331 0.3770 0.1662 0.0473 0.0064 0.0001 0.0000 0.0000 
5 1.0000 1.0000 0.9999 0.9936 0.9527 0.8338 0.6230 0.3669 0.1503 0.0328 0.0016 0.0001 0.0000 








有 用 的 统计 表 729 





f. n=10 
CS 


p 
k 0.01 0.05 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.95 0.99 
6 1.0000 1.0000 1.0000 0.9991 0.9894 0.9452 0.8281 0.6177 0.3504 0.1209 0.0128 0.0010 0.0000 
7 1.0000 1.0000 1.0000 0.9999 0,0084 0.9877 0.9453 0.8327 0.6172 0.322 0.0702 0.0115 — 0.0001 
8 
9 





1.0000 1.0000 1.0000 1.0000 0.9999 0.9983 0.9893 0.9536 0.8507 0.6242 0.2639 0.0861 0.0043 


1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9990 — 0.9940 0.9718 0.8926 0.6513 0.4013 — 0.0956 
g nzl5 
P 





k 0.01 0.05 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.95 0.99 

O 0.8601 0.4633 0.2059 0.0352 0.0047 0. 0005 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0. 0000 
1 0.9904 0.8290 0.5490 0.1671 0.0353 O. 0052 0.0005 0.0000 0.0000 0.0000 0.0000 0.0000 0. 0000 
2 09996 0.9638 0.8159 0.3980 0.1268 0.0271 0.0087 0.008 0.000 0.0000 o. 0000 0.0000 0.0000 
3 1.0000 0.9945 0.9444 0.6482 0.2969 0.0905 0.0176 0.0019 0.0001 0.0000 0.0000 0.0000 0.0000 
4 1.0000 0.9994 0.9873 0.8358 0.5155 oO. 2173 0.0592 0.0093 0.0007 0.0000 0.0000 0.0000 0. 0000 
5 1.0000 0.999 0.9978 0.9399 0716 O. 4032 0.1509 0.0333 0.0037 0.0001 0.0000 0.0000 0. 0000 
6 1.0000 1.0000 0.9997 0.9819 0.8689 0.6098 0.3086 0.0950 0.0152 0.0008 0. 0000 0.0000 0.0000 
7 1.0000 1.000 1.0000 0.9958 0.9500 oO. 7869 0.5000 0.2131 0.0500 0.0042 0.0000 0.0000 — 0.0000 
8 1.0000 1.000 1.0000 0.9992 0.9848 0.9050 0.6054 0.399 0.1311 0.0181 0.0003 0.0000 0.0000 
9 1.0000 1.0000 1.0000 0.999 0.9963 0.9662 0.8491 0.5968 0.2744 0.06511 0. 0022 0.000 0.0000 
10 1.000 1.000 1.0000 1.0000 0993 0 9907 0.9408 0.7827 0.4845 0.1642 0. 0127 0.0006 0.0000 


11 1.0000 1.0000 1.0000 1.0000 0.9990 0.9981 0.994 0.9095 0.70831 0. 3518 | 0.0556 0.0055 0.0000 
12 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9963 0.9729 0.872 0.6020 0. 1841 0.0362 0.0004 
13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9995 0.9948 0.9647 0.8329 0.4510 0.1710 0.0096 


14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9995 0.9953 0.9648 — 0.7941 0.5367 0.1399 
h. nz20 
p 


k 0.01 0.05 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.95 0.99 
O 0.8179 0.3585 0.1216 0.0115 0. 0008 0.0000 0.0000 0.0000 0.0000 0. 0000 0.0000 0.0000 0.0000 
1 0.9831 0.7358 0.3917 0.0692 0.0076 0.0005 0.0000 0.0000 0.0000 0.0000 o. 0000 0.0000 0.0000 
2 0.9990 0.9245 0.6769 0.2061 0.0355 0.0006 0.0002 0.0000 0.000 0.0000 o. 0000 0.0000 0.0000 
3 1.0000 0.9841 0.8670 0.4114 0.1071 0.0160 0.0013 0.0000 0.0000 0.0000 oO. 0000 0.0000 0.0000 
4 1.0000 0.9974 0.9568 0.6296 0.2375 0.0510 0.0059 0.0003 0.0000 0.0000 oO. 0000 0.0000 0.0000 
5 1.0000 0.9997 0.9887 0.8042 0.4164 0.1256 0.0207 0.0016 0.0000 0.0000 0.0000 0.0000 0.0000 
6 

7 

8 

9 

0 





1.0000 1.0000 0.9976 0.9133 0.6080 0.2500 0.0577 0.0065 0.0003 0.0000 0.0000 0.0000 0.0000 
1.0000 1.0000 0.996 0.9679 0.723 0. 4159 0.1316 0.0210 0.0013 0.0000 0. 0000 0.0000 0.0000 
1.0000 1.0000 0.9999 0.9900 0.8867 0.5956 0.2517 0.0565 0.0051 0.0001 0.0000 0.0000 0.0000 
1.000 1.0000 1.000 0.9974 0,920 oO. 7553 0.4119 0.1275 0.0171 0.006 0. 0000 0.0000 0.0000 
1.0000 1.0000. 1.0000 0.9994 0.9829 0.8725 0.5881 0.2447 0.0480 0.0026 0.0000 0.0000 0.0000 
1 1.000 1.0000 1.0000 0.9999 0.9949 0.9435 0.7483 0.4044 0.1133 0.0100 0.0001 0.0000 0.0000 
12 1.0000 1.0000 1.0000 1.0000 0.9987 0.9790 0.8684 0.5841 0.227] 0.0001 0.0004 0.0000 0.0000 
13 1.0000 1.000 1.0000 1.0000 0.9997 0.9935 0.9423 0.7500 0.3920 0.0867 0.0004 0.0000 0.0000 

















730 RE B 
9) 
h. n =20 
P 
k 0.01 0.05 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.95 0.99 
14 1.0000 1.0000 1.0000 1.0000 1.0000 0.9984 0.9793 0.8744 0.5836 0.1958 0.0113 0.0003 0.0000 
15 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9941 0.9490 0.7625 0.3704 0.0432 0.0006 0.0000 
16 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9987 0.9840 0.8929 0.5886 0.1330 0.0159 . 0.0000 
17 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9964 0.9645 0.7939 0.3231 0.0755 0.0010 
18 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9995 0.9924 0.9308 0.6083 0.2642 0.0160 
19 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9992 0985 0878 0.6415 0. 1821 
——————————MM———MM—ÉÉRÉ—————— eS vss VoD 0.1821 
L n =25 
p 

k 0.01 0.05 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.95 0.99 
O 0778 0.2774 0.0718 0.0038 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
1 0.9442 0.6424 0.2712 0.0274 0.0016 0.000 0.0000 0.0000 0.0000 0. 0000 0.0000 0.0000 0.0000 
2 0.9980 0.8729 0.5371 0.0982 0.0000 (0.0004 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
3 0.9999 0.9659 0.7636 0.2340 0.0332 0.0024 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
4 10000 0.9928 0.9020 0.4207 0.0905 0095 0.0005 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
5 1.0000 0.9988 0.9666 0.6167 0.1935 0.0294 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
6 1.0000 0.9998 0.9905 0.7800 0.3407 0036 0.0073 0.0008 0.0000 0.0000 0.0000 0.0000 0.0000 
7 1.0000 1.0000 0.9977 0.8909 0.5118 0.1536 0.0216 0.0012 0.0000 0.0000 0.0000 0.0000 0.0000 
8 10000 1.0000 0.9995 0.9532 0.6769 0.2735 0.0539 0.0043 0.0000 0. 0000 0.0000 0.0000 (0.0000 
9 1.0000 1.0000 0.9999 0.9827 0.8106 0.4246 0.1148 0.012 000 O. 0000 0.0000 0.0000 0.0000 
10 1.0000 1.0000 1.0000 0.9944 0.9022 0.5858 0.2122 0.0344 0.0018 0.0000 0.0000 0.0000 0.0000 
11 1.0000 1.0000 1.0000 0.9985 0.9558 0.7323 0.3450 0.0778 0.000 oO. 0001 0.0000 0.0000 0.0000 
12 1.000 1.0000 1.0000 0.9996 0.9825 0.8462 0.5000 0.1538 0.0175 0. 0004 0.0000 0.0000 0.0000 
13 1.0000 1.0000 1.0000 0.9999 0.9940 0.9222 0.6550 0.2677 0.0442 0.0015 0.0000 0.0000 0.0000 
14 1.0000 1.0000 1.0000 1.0000 0.9982 0.9656 0.7878 0.4142 0.0978 0.0056 | 0.0000 0.0000 0.0000 
15 1.0000 1.0000 1.0000 1.0000 0.9995 0.9868 0.8852 0.5754 0.1894 0.0173 0.0001 0.0000 0.0000 
16 1.0000 1.0000 1.0000 1.0000 0.9900 0.9957 0.9461 0.7260 0.3231 0.0468 0.0005 0.0000 0.0000 
17 1.0000 1.0000 1.0000 1.0000 1.0000 0.9988 0.9784 0.8464 0.4882 0.1091 0.0023 0.0000 0.0000 
18 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.997 0.964 0.6593 0.2200 0.0005 0.0002 0.0000 
19 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9980 0.9706 0.8065 0.3833 0.0334 0.0012 0.0000 
20 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9995 0.9905 0.9005 0.5793 0.0980 0.0072 0.0000 
21 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9976 0.9668 0.7660 | 0.2364 0.0341 0.0001 
22 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9996 0.9910 0.9018 0.4629 0.1271 0.0000 
23 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9084 0.9726 0.7288 0.3576 0.0258 
24 1.0000 1.0000 


1.0000 1.0000 1.0000 (1.0000 1.0000 1.0000 0.9999 0.9962 0.98 0.726 0.222 
——  ——  — — 1000%0 0.9999 0.99002 0.9282 0.726 0.222 - 
表 B.3 指数 









À 


e 


-À 













1. 000000 
0. 951229 
0. 904837 





2.05 
2. 10 
2.15 


0. 128735 
0. 122456 
0. 116484 





4. 05 
4.10 
“ 4.15 













0.017422 
0.016573 
0.015764 





6.05 
6.10 
6.15 





0.002358 
0. 002243 
0.002133 









8.05 
8.10 
8.15 


0. 000319 
0. 000304 
0. 000289 














青 用 的 统计 表 731 








(5E) 
À e^ À e^^ À e^ À e^? À e 

0. 15 0. 860708 2. 20 0. 110803 4. 20 0. 014996 6.20 0. 002029 8.20 0. 000275 
0.20 0.818731 2.25 0. 105399 4.25 0. 014264 6.25 0. 001930 8.25 0. 000261 
0.25 0. 778801 2.30 0. 100259 4. 30 0. 013569 6.30 0. 001836 8.30 0. 000249 
0. 30 0. 740818 2.35 0. 095369 4.35 0. 012907 6.35 0. 001747 8. 35 0. 000236 
0.35 0. 704688 2.40 0.090718 4.40 0. 012277 6.40 0. 001661 8. 40 0. 000225 
0. 40 0. 670320 2.45 0. 086294 4. 45 0. 011679 6.45 0. 001581 8.45 0. 000214 
0. 45 0. 637628 2. 50 0. 082085 4.50 0. 011109 6.50 0. 001503 8.50 0. 000204 
0. 50 0. 606531 2.55 0. 078082 4. 55 0. 010567 6.55 0. 001430 8.55 0. 000194 
0.55 0. 576950 2. 60 0. 074274 4. 60 0. 010052 6. 60 0. 001360 8. 60 0. 000184 
0. 60 0. 548812 2.65 0. 070651 4.65 0. 009562 6.65 0. 001294 8.65 0. 000175 
0.65 0. 522046 2.70 0. 067206 4.70 0. 009095 6.70 0.001231 8.70 0.000167 
0.70 0.496585 2.75 0. 063928 4.75 0. 008652 6.75 0.001171 8.75 0.000158 
0.75 0.472367 2. 80 0. 060810 4. 80 0. 008230 6. 80 0. 001114 8. 80 0. 000151 
0. 80 0. 449329 2. 85 0. 057844 4. 85 0. 007828 6. 85 0. 001059 8.85 0. 000143 
0.85 0. 427415 2.90 0. 055023 4. 90 0. 007447 6. 90 0. 001008 8.90 0. 000136 
0. 90 0. 406570 2.95 0. 052340 4.95 0. 007083 6.95 0. 000959 8.95 0. 000130 
0.95 0. 386741 3. 00 0. 049787 5.00 0. 006738 7.00 0. 000912 9. 00 0. 000123 
1.00 0. 367879 3.05 0. 047359 5.05 0. 006409 7.05 0. 000867 9.05 0. 000117 
1.05 0. 349938 3.10 0. 045049 5.10 0. 006097 7.10 0. 000825 9.10 0. 000112 
1.10 0. 332871 3.15 0. 042852 5.15 0. 005799 7.15 0. 000785 9.15 0. 000106 
1.15 0. 316637 3.20 0. 040762 5.20 0. 005517 7.20 0. 000747 9.20 0. 000101 
1.20 0. 301194 3.25 0. 038774 5.25 0. 005248 7.25 0. 000710 9. 25 0. 000096 
1.25 0. 286505 3.30 0. 036883 5.30 0. 004992 7.30 0. 000676 9.30 0. 000091 
1. 30 0. 272532 3.35 0. 035084 5.35 0. 004748 7.35 0. 000643 9.35 0. 000087 
1.35 0. 259240 3.40 0. 033373 5.40 0. 004517 7.40 0. 000611 9. 40 0. 000083 
1.40 0. 246597 3. 45 0. 031746 5.45 0. 004296 7.45 0. 000581 9. 45 0. 000079 
1.45 0. 234570 3.50 0. 030197 5.50 0. 004087 7.50 0. 000553 9. 50 0. 000075 
1. 50 0. 223130 3.55 0. 028725 5.55 0. 003887 7.55 0. 000526 9.55 0. 000071 
1.55 0. 212248 3. 60 0. 027324 5.60 0. 003698 7.60 0. 000501 9. 60 0. 000068 
1.60 0. 201897 3. 65 0. 025991 5.65 0. 003518 7.65 0. 000476 9. 65 0. 000064 
1.65 0. 192050 3. 70 0. 024724 5. 70 0. 003346 7.70 0. 000453 9. 70 0. 000061 
1. 70 0. 182684 3.75 0. 023518 5.75 0. 003183 7.75 0. 000431 9.75 0. 000058 
1.75 0. 173774 3.80 0. 022371 5. 80 0. 003028 7.80 0. 000410 9. 80 0. 000056 
1.80 0. 165299 3. 85 0. 021280 5. 85 0. 002880 7.85 0. 000390 9.85 0. 000053 
1.85 0.157237 3.90 0. 020242 5.90 0. 002739 7.90 0. 000371 9. 90 0. 000050 
1.90 0. 149569 3.95 0. 019255 5.95 0. 002606 7.95 0. 000353 9.95 0. 000048 
1.95 0. 142274 4. 00 0. 018316 6. 00 0. 002479 8.00 0. 000336 10. 00 0. 000045 
2 0 














.00 . 135335 


RBA REDE 
制 表 值 是 Y P(y) | 


泊 松 均值 jy 


k 0.5 ` 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 
0 0.6065 0.3679 0.2231 0.1353 0.0821 0.0498 0.0302 0.0183 0.0111 0.0067 























732 附录 B 
( 续 ) 
TRASH u 
k 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 
l. 0.9098 0.7358 0.5578 0.4060 0.2873 0.1991 0.1359 0.0916 0.0611 0.0404 
2 0.9856 — 0.9197 0.8088 0.6767 0.5438 0.4232 0.3208 0.2381 0.1736 0.1247 
3 0.9982 0.9810 — 0.9344 0.8571 0.7576 0.6472 0.5366 0.4335 0.3423 0.2650 
4 0.9998 — 0.9963 0.9814 0.9473 0.8912 0.8153 0.7254 0.6288 0.5321 0.4405 
5 1.0000 0.9994 0.9955 0.9834 0.9580 0.9161 0.8576 0.7851 0.7029 0.6160 
6 1.0000 0.9999 0.9991 0.9955 0.9858 0.9665 0.9347 0.8893 0.831 0.7622 
7 1.0000 — 1.0000 0.9998 0.9989 0.9958 0.9881 0.9733 0.9489 0.9134 0.8666 
8 1.0000 — 1.0000 1.0000 0.9998 0.9989 0.9962 0.9901 0.9786 0.9597 0.9319 
9 1.0000 — 1.0000 — 1.0000 — 1.0000 0.9997 0.9989 0.9967 0.9919 0.9829 0.9682 
10 1.0000 — 1.0000 1.0000 1.0000 0.9999 0.9997 0.9990 0.9972 0.9933 0.9863 
1 1.0000 — 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9991 0.9976 0.9945 
12 1.0000 — 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9992 0.9980 
13 1.0000 — 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9993 
14 1.0000 — 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 — 0.9998 
15 1.0000 — 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 
16 1.0000 — 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
17 1.0000 — 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
18 1.0000 — 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
19 1.0000 — 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
20 1.0000 — 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
泊 松 均值 几 
k 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 10.0 
0 0.0041 0.005 — 0.0055 — 0.009 — 0.006 — 0.008 0.032 — 0.0001 0.0001 0.0000 
1 0.0006 — 0.00774 — 0.0113 | 0.0033 — 0.0047 — 0.0000 0.0019 — 0.0012 — 0.0008 0.0005 
2 0.0884 0.0620 — 0.0430 — 0.02956 — 0.0203 0.0138 0.0093 0.002 — 0.0042 0.0028 
3 0.20 — 0.1512 0.1118 0.0818 0.0501 0.0004 — 0.0301 0.0012 — 0.0149 0.0108 
4 0.3575 — 0.2851 0.2277 0.1730 . 0.132 0.0006 — 0.0744 — 0.0550 — 0.0408 0.0293 
5 0.5289 — 0.4457 0.3600 — 0.307 . 0.2414 0.1912 0.1496 0.1157 0.0885 0.0671 
6 0.6860 — 0.6068 | 0.52260 — 0.449] — 0.372 0.3134 0.2562 0.2068 — 0.1649 0.1301 
7 0.8005 — 0.7440 — 0.6728 0.598] — 0.5246 0.4530 — 0.3856 0.3239 0.2687 0.2202 
8 0.8944 0.8472 . 0.7916 0.7201 0.600 | 0.595 0.5231 0.4557 — 0.3018 0.3328 
9 0.9460 0.9161 0.8774 . 0.830 — 0.7764 0.7166 — 0.6530 — 0.5874 0.5218 0.4579 
10 0.9747 — 0.9574 0.9322 . 0.9005 0.8622 0.8159 — 0.764 0.7000 | 0.6453 0. 5830 
11 0.980 — 0.979 0.9661 0.9467 — 0.908 0.8881 0.8487 — 0.8000 — 0.7520 0. 6968 
12 0.9555 — 0.992 — 0.980 09730 0.9573 0.9362 0.9091 0.8758 — 0.8364 0.7916 
13 0.9983 0.9964 — 0.909 0.9872 098 0.96588 0.9486 — 0.906 0.8981 0.8645 
14 0.9994 0.9986 0.9970 0.9943 0.9897 0.9827 09726 0.9585 0.9400 0.9165 
15 0.9998 — 0.9905 0.9988 0.9976 0.9954 0.9918 0.9862 0.9780 0.9665 0.9513 
16 0.9999 0.9998 0.9996 0.9990 0.9980 0.9963 0.9934 0.9889 0983 0.9730 
17 1.0000 0.9999 — 0.998 0.9996 0.992 0.9984 0.990 0997 0.9911 0.9857 
18 1.0000 1.0000 | 0,999 — 0,999 0.997 0.993 0.9987 0.996 0.9957 0.9928 
19 1.0000 1.0000 1.0000 1.0000 — 0.9999 — 0.9997 0.9995 0.9989 > 0.9980 0.9965 


有 用 的 统计 表 i 733 





RBS 正 态 曲线 面积 








fx) 
0 z 
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 
0.3 0.1179 0.1217 0.1255 0. 1293 0. 1331 0. 1368 0.1406 0. 1443 0. 1480 0.1517 
0.4 0.1554 0.1591 0.1628 0. 1664 0. 1700 0. 1736 0.1772 0. 1808 0. 1844 0.1879 
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0. 2088 0. 2123 0.2157 0.2190 0.2224 
0.6 0.2257 0.2291 0.2324 0.2357 0. 2389 0.2422 0.2454 0.2486 0.2517 0.2549 
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0. 2734 0. 2764 0.2794 0. 2823 0.2852 
0.8 0.2881 0.2910 0. 2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0. 3133 
0.9 0.3159 0.3186 0. 3212 0. 3238 0. 3264 0.3289 0. 3315 0.3340 0. 3365 0.3389 
1.0 0.3413 0. 3438 0.3461 0.3485 0. 3508 0.3531 0.3554 0.3577 0.3599 0.3621 
1.1 0. 3643 0. 3665 0. 3686 0. 3708 0. 3729 0.3749 0.3770 0.3790 0.3810 0. 3830 
1.2 0. 3849 0. 3869 0.3888 0.3907 0. 3925 0. 3944 0. 3962 0. 3980 0. 3997 0.4015 
1.3 0. 4032 0. 4049 0. 4066 0.4082 0. 4099 0.4115 0.4131 0.4147 0.4162 0.4177 
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0. 4265 0. 4279 0. 4292 0. 4306 0.4319 
1.5 0.4332 0. 4345 0.4357 0.4370 0. 4382 0.4394 0. 4406 0.4418 0.4429 0.4441 
1.6 0.4452 0. 4463 0. 4474 0.4484 0. 4495 0. 4505 0.4515 0.4525 0.4535 0.4545 
1.7 0.4554 0.4564 0.4573 0.4582 0. 4591 0.4599 0. 4608 0. 4616 0. 4625 0. 4633 
1.8 0. 4641 0.4649 0. 4656 0. 4664 0.4671 0. 4678 0. 4686 0. 4693 0.4699 0.4706 
1.9 0. 4713 0.4719 0. 4726 0. 4732 0. 4738 0. 4744 0.4750 0.4756 0. 4761 0. 4767 
2.0 0.4772 0.4778 0. 4783 0.4788 0. 4793 0. 4798 0. 4803 0. 4808 0.4812 0. 4817 
2.1 0. 4821 0. 4826 0. 4830 0.4834 0.4838 0.4842 0. 4846 0.4850 0.4854 0. 4857 
2.2 0. 4861 0. 4864 0. 4868 0.4871 0.4875 0.4878 0. 4881 0. 4884 0. 4887 0. 4890 
2.3 0. 4893 0. 4896 0. 4898 0.4901 0. 4904 0. 4906 0.4909 0.4911 0. 4913 0.4916 
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0. 4929 0. 4931 0.4932 0.4934 0. 4936 
2.5 0.4938 0.4940 0.4941 0.4943 0. 4945 0.4946 0. 4948 0.4949 0.4951 0. 4952 
2.6 0. 4953 0. 4955 0.4956 0.4957 0.4959 0. 4960 0. 4961 0.4962 0. 4963 0. 4964 
2.7 . 0.4965 0. 4966 0.4967 0. 4968 0. 4969 0. 4970 0. 4971 0.4972 0. 4973 0. 4974 
2.8 0. 4974 0.4975 0.4976 0. 4977 0.4977 0. 4978 0.4979 0. 4979 0.4980 0. 4981 
2.9 0.4981 0.4982 0.4982 0.4983 0. 4984 0.4984 0.4985 0.4985 0. 4986 0. 4986 
3.0 0. 4987 0. 4987 0.4987 0. 4988 0. 4988 0. 4989 0. 4989 0.4989 0.4990 0. 4990 


资料 来 源 : Table 1 of Hald , A. Statistical Tables and Formulas( New York: Wiley) , 1952, Reproduced by permission of A. Hald and the 
publisher. John Wiley & Sons, Inc. 
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表 B.6 r mh 


dx;l'(n + 1) = nT(n) WÉ 


n T (n) n T(n) n T (n) n T(n) 





资料 来 源 : Beyer, W. H. ( ed. ) Handbook of Tables for Probability and Statistics , 
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1966. Reproduced by permission of the publisher, The 








X B.7 学 生 了 的 临界 值 
f) 
0 m I 
v to. 100 19.050 19.925 19.10 1o. oos 1o. 001 19.0005 
1 3.078 6.314 12.706 31.821 63.657 318.31 636.62 
2 1. 886 2.920 4.303 6.965 9.925 22.326 31.598 
3 1.638 2.353 3.182 4.541 5.841 10.213 12.924 
4 1.533 2.132 2.776 3.747 4.604 7.173 8.610 
5 1.476 2.015 2.571 3.365 4.032 5.893 6.869 
6 1.440 1.943 2.447 3.143 3.707 5.208 5.959 
7 1.415 1.895 2.365 2.998 3.499 4.785 5.408 
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(E) 

1.397 1.860 2.306 2. 896 3.355 4.501 5.041 

9 1.383 1.833 2.262 2.821 3.250 4.297 4.781 
10 1.372 1.812 2.228 2.764 3.169 4.144 4.587 
11 1.363 1.796 2.201 2.718 3.106 4.025 4.437 
12 1.356 1.782 2.179 2.681 3.055 3.930 4.318 
13 1.350 1.771 2.160 2.650 3.012 3.852 4.221 
14 1.345 1.761 2.145 2.624 2.977 3.787 4.140 
15 1.341 1.753 2.131 2.602 2.947 3.733 4.073 
16 1.337 1.746 2.120 2.583 2.92] 3.686 4.015 
17 1.333 1.740 2.110 2.567 2. 898 3.646 3.965 
18 1.330 1.734 2.101 2.552 2. 878 3.610 3.922 
19 1.328 1.729 2.093 2.539 2. 861 3.579 3. 883 
20 1.325 1.725 2.086 2.528 2. 845 3.552 3.850 
21 1.323 1.721 2.080 2.518 2.831 3.527 3.819 
22 1.321 1.717 2.074 2.508 2.819 3.505 3.792 
23 1.319 1.714 2. 069 2.500 2.807 3.485 3.767 
24 1.318 1.71 2. 064 2.492 2.797 3.467 3.745 
25 1.316 1.708 2.060 2.485 2.787 3.450 3.725 
26 1.315 1.706 2.056 2.479 2.779 3.435 3.707 
27 1.314 1.703 2.052 2.473 2.771 3.421 3.690 
28 1.313 1.701 2.048 2.467 2.763 3.408 3.674 
29 1.311 1.699 2.045 2.462 2.756 3.396 3.659 
30 1.310 1.697 2.042 2.457 2.750 3.385 3.646 
40 1.303 1.684 2.021 2.423 2.704 3.307 3.551 
60 1.296 1.671 2.000 2.390 2.660 3.232 3.460 
120 1.289 1.658 1.980 2.358 2.617 3.160 3.373 
œ 1.282 1.645 1.960 2.326 2.576 3.090 3.291 


资料 来 源 : Pearson, E. S. , and Hartley, H. O. ( eds. ) The Biometrika Tables for Statisticians, Vol. 1, 3rd ed. , Biometrika , 1966. repro- 


duced with the kind permission of the Trustees of Biometrika. 
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foe) 
> x 
0 x: 
B 由 oH X. 995 0.990 x. 975 X6. 950 X0. 900 
1 0. 0000393 0. 0001571 0. 0009821 0.0039321 0.0157908 
2 0.0100251 0.0201007 0.0506356 0.102587 0.210720 
3 0.0717212 0.114832 0.215795 0.351846 0.584375 
4 0.206990 0.297110 0.484419 0.710721 1.063623 
5 0.411740 0.554300 0.831211 1.145476 1.61031 
6 0.675727 0. 872085 1. 237347 1.63539 2.20413 
































736 附录 B 
( 续 ) 
自 由 x. 995 X0. ooo X. 975 Xi. 950 X. 900 
7 0. 989265 1. 239043 1.68987 2.16735 2.83311 
8 1.344419 1.646482 2.17973 2.73264 3.48954 
9 1.734926 2.087912 2.70039 3.32511 4.16816 
10 2.15585 2.55821 3.24697 3.94030 4. 86518 
11 2.60321 3.05347 3.81575 4.57481 5.57719 
12 3.07382 3.57056 4.40379 5.22603 6.30380 
13 3.56503 4. 10691 5.00874 5.89186 7.04150 
14 4.07468 4. 66043 5.62872 6. 57063 7.778953 
15 4. 60094 5.22935 6.26214 7.26094 8.54675 
16 5.14244 5.81221 6.90766 7.96164 9.31223 
17 5.69724 6.40776 7.56418 8.67176 10. 0852 
18 6.26481 7.01491 8.23075 9.39046 10. 8649 
19 6. 84398 7.63273 8.90655 10. 1170 11.6509 
20 7.43386 8. 26040 9.59083 10. 8508 12. 4426 
21 8.03366 8.89720 10. 28293 11.5913 13.2396 
22 8.64272 9.54249 10. 9823 12. 3380 14.0415 
23 9.26042 10. 19567 11.6885 13.0905 14. 8479 
24 9.88623 10. 8564 12.4011 13. 8484 15.6587 
25 10. 5197 11.5240 13. 1197 14.6114 16. 4734 
26 11.1603 12.1981 13.8439 15. 3791 17.2919 
27 11. 8076 12. 8786 14. 5733 16. 1513 18. 1138 
28 12.4613 13. 5648 15. 3079 16.9279 18. 9392 
29 13. 1211 14. 2565 16.0471 17.7083 19. 7677 
30 13.7867 14.9535 16. 7908 18.4926 20. 5992 
40 20. 7065 22.1643 24.4331 26.5093 29.0505 
50 27.9907 29. 7067 32.3574 34.7642 37.6886 
60 35. 5346 37.4848 40. 4817 43.1879 46.4589 
70 43.2752 45.4418 48.7576 51. 7393 55. 3290 
80 51.1720 53. 5400 57.1532 60.3915 64.2778 
90 59. 1963 61.7541 65. 6466 69. 1260 73.2912 
100 67.3276 70. 0648 74.2219 71.9295 82.3581 
B 由 x. 100 X6. oso X6. ms X0. ol0 x. 005 
1 2.70554 3.84146 5.02389 6.63490 7.87944 
2 4.60517 5.99147 7.377176 9. 21034 10. 5966 
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(E) 
(OR BOR w ia da Xo m 
3 6.25139 7.81473 9.34840 11.3449 12.8381 
4 7.17944 9.48773 11.1433 13.2767 . 14. 8602 
5 9.23635 11.0705 12. 8325 15. 0863 16.7496 
6 10. 6446 12. 5916 14. 4494 16. 8119 18.5476 
7 12.0170 14.0671 16.0128 18. 4753 20.2777 
8 13. 3616 15. 5073 17.5346 20. 0902 21.9550 
9 14. 6837 16.9190 19.0228 21. 6660 23.5893 
10 15.9871 18. 3070 20. 4831 23.2093 25.1882 
11 17.2750 19.6751 21.9200 。 24.7250 26.7569 
12 18.5494 21.0261 23.3367 26.2170 28.2995 
13 19. 8119 22.3621 24. 7356 27.6883 29. 8194 
14 21.0642 23. 6848 26. 1190 29.1413 31.3193 
15 22.3072 24.9958 27.4884 30. 5779 32. 8013 
16 23.5418 26. 2962 28. 8454 31.9999 34.2672 
17 24.7690 27.5871 30. 1910 33.4087 35.7185 
18 25.9894 28. 8693 31.5264 34. 8053 37.1564 
19 27.2036 30. 1435 32.8523 36. 1908 38.5822 
20 28.4120 31.4104 34.1696 37.5662 39. 9968 
21 29.6151 32. 6705 35.4789 38.9321 41.4010 
22 30.8133 33.9244 36.7807 40. 2894 42. 7956 
23 32.0069 35.1725 38.0757 41.6384 44.1813 
24 33.1963 36.4151 39. 3641 42.9798 45. 5585 
25 34.3816 37.6525 40. 6465 44.3141 46.9278 
26 35.5631 38. 8852 41.9232 45. 6417 48.2899 
27 36.7412 40. 1133 43.1944 46.9630 49. 6449 
28 37.9159 41.3372 44.4607 48. 2782 50. 9933 
29 39.0875 42.5569 45. 7222 49. 5879 52.3356 
30 40. 2560 43.7729 46.9792 50. 8922 53.6720 
40 51. 8050 55. 7585 59.3417 63.6907 66. 7659 
50 63.1671 67.5048 71.4202 76.1539 79.4900 
60 74.3970 79.0819 83.2976 88. 3794 91.9517 
70 85. 5277 90. 5312 95. 0231 100. 425 104.215 
80 96. 5782 101.879 106. 629 112. 329 116.321 
90 107. 565 113. 145 118.136 124.116 128. 299 
100 118.498 124.342 129. 561 135. 807 140. 169 


资料 来 源 :Thompson，C. M. “Tables of the percentage points of the Y? distribution. " Biometrika, 1941, Vol. 32, pp. 188-189. Repro- 


duced by permisson of the Biometrika Trustees. 
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X B. 9 乒 分 布 的 百 分 位 点 , e =0. 10 


KE) 

















1 39.86 49.50 53.59 55.83 57.24 58.20 58.91 59.44 59.86 

2 53 9.00 9.16 9.24 9.29 9.33 9.35 9.37 9.38 

3 5.54 5.46 5.39 5.34 5.31 5.28 5.27 5.25 5.24 

4 4.54 4.32 4.19 4.11 4.05 4.01 3.98 3.95 3.94 

5 4.06 3.78 3.62 3.52 3.45 3.40 3.37 3.34 3.32 

6 3.78 3.46 3.29 3.18 3.11 3.05 3.01 2.98 2.96 

7 3.59 3.26 3.07 2.96 2.88 2.83 2.78 2.75 2.72 

8 3.46 3.11 2.92 2.81 2.73 2.67 2.62 2.59 2.56 

9 3.36 3.01 2.81 2.69 2.61 2.55 2.51 2.47 2.44 

10 3.29 2.92 2.73 2.61 2.52 2.46 2.41 2.38 2.35 

11 3.23 2.86 2.66 2.54 2.45 2.39 2.34 2.30 2.27 

12 3.18 2.81 2.61 2.48 2.39 2.33 2.28 2.24 2.21 

13 3.14 2.76 2.56 2.43 2.35 2.28 2.23 2.20 2.16 

14 3.10 2.73 2.52 2.39 2.31 2.24 2.19 2.15 2.12 

分 15 3.07 2.70 2.49 2.36 2.27 2.21 2.16 2.12 2.09 
8 16 3.05 2.67 2.46 2.33 2.24 2.18 2.13 2.09 2.06 
17 3.03 2.64 2.44 2.31 2.22 2.15 2.10 2.06 2.03 

H 18 3.01 2.62 2.42 2.29 2.20 2.13 2.08 2.04 2.00 
由 19 2.99 2.61 2.40 2.27 2.18 2.11 2.06 2.02 1.98 
E 20 2.97 2.59 2.38 2.25 2.16 2.09 2.04 2.00 1.96 
21 2.96 2.57 2.36 2.23 2.14 2.08 2.02 1.98 1.95 

22 2.95 2.56 2.35 2.22 2.13 2.06 2.01 1.97 1.93 

23 2.94 2.55 2.34 2.21 2.11 2.05 1.99 1.95 1.92 

24 2.93 2.54 2.33 2.19 2.10 2.04 1.98 1.94 1.91 

25 2.92 2.53 2.32 2.18 2.09 2.02 1.97 1.93 1.89 

26 2.91 2.52 2.31 2.17 2.08 2.01 1.96 1.92 1.88 

27 2.90 2.51 2.30 2.17 2.07 2.00 1.95 1.91 1.87 

28 2.89 2.50 2.29 2.16 2.06 2.00 1.94 1.90 1.87 

29 2.89 2.50 2.28 2.15 2.06 1.99 1.93 1.89 1.86 

30 2.88 2.49 2.28 2.14 2.05 1.98 1.93 1.88 1.85 

40 2.84 2.44 2.23 2.09 2.00 1.93 1.87 1.83 1.79 

60 2.79 2.39 2.18 2.04 1.95 1.87 1.82 1.77 1.74 

120 2.75 2.35 2.13 1.99 1.90 1.82 1.77 1.72 1.68 

oo 2.71 2.30 2.08 1.94 1.85 1.77 1.72 1.67 1.63 
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I 60.19 60.71 61.22 61.74 62.00 62.26 62.53 62.79 63.06 63.33 
2 9.39 9.41] 9.42 9.44 9.45 9.46 9.47 9.47 9.48 9.49 
3 5.23 5.22 5.20 5.18 5.18 5.17 5.16 5.15 5.14 5.13 
4 3.92 3.90 3.87 3.84 3.83 3.82 3.80 3.79 3.78 3.76 
5 3.30 3.27 3.24 3.21 3.19 3.17 3.16 3.14 3.12 3.10 
6 2.94 2.90 2.87 2.84 2.82 2.80 2.78 2.76 2.74 2.72 
7 2.70 2.67 2.63 2.59 2.58 2.56 2.54 2.51 2.49 2.47 
8 2.54 2.50 2.46 2.42 2.40 2.38 2.36 2.34 2.32 2.29 
9 2.42 2.38 2.34 2.30 2.28 2.25 2.23 2.21 2.18 2.16 
10 2.32 2.28 2.24 2.20 2.18 2.16 2.13 2.11 2.08 2.06 
11 2.25 2.21 2.17 2.12 2.10 2.08 2.05 2.03 2.00 1.97 
12 2.19 2.15 2.10 2.06 2.04 2.01 1.99 1.96 1.93 1.90 
13 2.14 2.10 2.05 2.01 1.98 1.96 1.93 1.90 1.88 1.85 
14 2.10 2.05 2.01 1.96 1.94 1.91 1.89 1.86 1.83 1.80 
15 2.06 2.02 1.97 1.92 1.90 1.87 1.85 1.82 1.79 1.76 
分 16 2.03 1.99 1.94 1.89 1.87 1.84 1.81 1.78 1.75 1.72 
5 17 2.00 1.96 1.91 1. 86 1.84 1.81 1.78 1.75 1.72 1.69 
18 1.98 1.93 1.89 1.84 1.81 1.78 1.75 1.72 1.69 1.66 
m 19 1.96 1.91 1.86 1.81 1.79 1.76 1.73 1.70 1.67 1.63 
20 1.94 1.89 1.84 1.79 1.77 1.74 1.71 1.68 1.64 1.61 
21 1.92 1.87 1.83 1.78 1.75 1.72 1.69 1.66 1.62 1.59 
22 1.90 1.86 1.81 1.76 1.73 1.70 1.67 1.64 1.60 1.57 
23 1.89 1.84 1.80 1.74 1.72 1.69 1.66 1.62 1.59 1.55 
24 1.88 1.83 1.78 1.73 1.70 1.67 1.64 1.61 1.57 1.53 
25 1.87 1.82 1.77 1.72 1.69 1.66 1.63 1.59 1.56 1.52 
26 1.86 1.81 1.76 1.71 1.68 1.65 1.61 1.58 1.54 1.50 
27 1.85 1.80 1.75 1.70 1.67 1.64 1.60 1.57 1.53 1.49 
28 1.84 1.79 1.74 1.69 1.66 1.63 1.59 1.56 1.52 1.48 
29 1.83 1.78 1.73 1.68 1.65 1.62 1.58 1.55 1.51 1.47 
30 1.82 1.77 1.72 1.67 1.64 1.61 1.57 1.54 1.50 1.46 
40 1.76 1.71 1.66 1.61 1.57 1.54 1.51 1.47 1.42 1.38 
60 1.71 1.66 1.60 1.54 1.51 1.48 1.44 1.40 1.35 1.29 
120 1.65 1.60 1.55 1.48 1.45 1.41 1.37 1.32 1.26 1.19 
oo 1.60 1.55 1.49 1.42 1.38 












资料 来 源 : Merrington M. and Thompson, C. M. “Tables of percentage points of the inverted beta ( F ) -distribution. " Biometrika , 
1943, Vol. 33, pp. 73-88. Reproduced by permission of the Biometrika Trustees. 
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表 B. 10 上 分 布 的 百 分 位 点 ,a =0. 05 


分 子 自 由 度 











RR ER mr ccu 











1 2 3 4 5 6 7 8 9 
1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 
2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 
3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 
4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 
5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 
6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 
8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 
10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 
11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 
12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 
13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 
15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 
16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 
17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 
18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 
19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 
20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 
21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 
22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 
23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 
24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 
25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 
26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 
27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 
28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 
29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22 
30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 
40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 
60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 
120 3.92 3.07 2.68 2.45 2.29 2.17 2.09 2.02 1.96 
op 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88 





有 有 用 的 统计 表 741 
( 续 ) 















分 子 自由 度 
10 12 15 20 24 30 40 60 120 E 

1 241.9 243.9 245.9 248.0 249.1 250.1 251.1 252.2 253.3 254.3 

2 19.40 19.41 19.43 19.45 19.45 19.46 19.47 19.48 19.49 19.50 

3 8.79 8.74 8.70 8.66 8.64 8.62 8.59 8.57 8.55 -8.53 

4 5.96 5.91 5.86 5.80 5.77 5.75 5.72 5.69 5.66 5.63 

5 4.74 4.68 4.62 4.56 4.53 4.50 4.46 4.43 4.40 4.36 

6 4.06 4.00 3.94 3.87 3.84 3.81 3.77 3.74 3.70 3.67 

7 3.64 3.57 3.51 3.44 3.41 3.38 3.34 3.30 3.27 3.23 

8 3.35 3.28 3.22 3.15 3.12 3.08 3.04 3.01 2.97 2.93 

9 3.14 3.07 3.01 2.94 2.90 2.86 2.83 2.79 2.75 2.71 

10 2.98 2.91 2.85 2.77 2.74 2.70 2.66 2.62 2.58 2.54 

11 2.85 2.79 2.72 2.65 2.61 2.57 2.53 2.49 2.45 2.40 

12 2.75 2.69 2.62 2.54 2.51 2.47 2.43 2.38 2.34 2.30 

13 2.67 2.60 2.53 2.46 2.42 2.38 2.34 2.30 2.25 2.21 

14 2.60 2.53 2.46 2.39 2.35 2.31 2.27 2.22 2.18 2.13 

15 2.54 2.48 2.40 2.33 2.29 2.25 2.20 2.16 2.11 2.07 

分 16 2.49 2.42 2.35 2.28 2.24 2.19 2.15 2.11 2.06 2.01 
i 17 2.45 2.38 2.31 2.23 2.19 2.15 2.10 2.06 2.01 1.96 
Ñ 18 2.41 2.34 2.27 2.19 2.15 2.11 2.06 2.02 1.97 1.92 
m 19 2.38 2.31 2.23 2.16 2.1 2.07 2.03 1.98 1.93 1.88 
20 2.35 2.28 2.20 2.12 2.08 2.04 1.99 1.95 1.90 1.84 

21 2.32 2.25 2.18 2.10 2.05 2.01 1.96 1.92 1.87 1.81 

22 2.30 2.23 2.15 2.07 2.03 1.98 1.94 1.89 1.84 1.78 

23 2.27 2.20 2.13 2.05 2.01 1.96 1.91 1.86 1.81 1.76 

24 2.25 2.18 2.11 2.03 1.98 1.94 1.89 1.84 1.79 1.73 

25 2.24 2.16 2.09 2.01 1.96 1.92 1.87 1.82 1.77 1.71 

26 2.22 2.15 2.07 1.99 1.95 1.90 1.85 1.80 1.75 1.69 

27 ' 2.20 2.13 2.06 1.97 1.93 1.88 1.84 1.79 1.73 1.67 

28 2.19 2.12 2.04 1.96 1.91 1.87 1.82 1.77 1.71 1.65 

29 2.18 2.10 2.03 1.94 1.90 1.85 1.81 1.75 1.70 1.64 

30 2.16 2.09 2.01 1.93 1.89 1.84 1.79 1.74 1.68 1.62 

40. 2.08 2.00 ` 1.92 1.84 1.79 1.74 1.69 1.64 1.58 1.51 

60 1.99 1.92, 1.84 1.75 1.70 1.65 1.59 1.53 1.47 1.39 

120 . 1.91 1.83 1.75 1.66 1.61 1.55 1.50 1.43 1.35 1.25 

æ 1.83 1.75 1.67 1.57 1.52 1.46 1.39 1.32 1.22 1.00 









资料 来 源 : Merringtom, M: ，and Thompson, C. M. “Table of percentage points of the inverted beta ( F)-distribution". Biometrika , 
1943, Vol.33, pp. 77-88. Reproduced by permission of the Biometrika Trustees. 


742 





KF) 


5 B.11 


三 分 布 的 百 分 位 点 , x =0. 025 
































2 3 4 5 6 7 8 9 

1 647.8 799.5 864.2 899.6 921.8 937.1 948.2 956.7 963.3 
2 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 
3 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14. 54 14.47 
4 12.22 10. 65 9. 98 9.60 9.36 9.20 9.07 8.98 8.90 
5 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 
6 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 
7 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 
8 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 

9 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 
10 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 
11 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 
12 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 

13 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31 

14 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 
4 15 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 
B 16 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05 
17 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98 

H 18 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 
由 19 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96 2.88 
E 20 5.87 4.46 3. 86 3.51 3.29 3.13 3.01 2.91 2.84 
21 5.83 4.42 3.82 3.48 3.25 3.09 2.97 2.87 2.80 
22 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84 2.76 

23 5.75 4.35 3.75 3.41 3.18 3.02 2.90 2.81 2.73 
24 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 
25 5.69 4.29 3.69 3.35 3.13 2.97 2.85 2.75 2.68 
26 5.66 4.27 3.67 3.33 3.10 2.94 2.82 2.73 2.65 

27 5.63 4.24 3.65 3.31 3.08 2.92 2.80 2.71 2.63 

28 5.61 4.22 3.63 3.29 3.06 2.90 2.78 2.69 2.61 
29 5.59 4.20 3.61 3.27 3.04 2.88 2.76 2.67 2.59 

30 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 

40 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 

60 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 
120 5.15 3.80 3.23 2.89 2.67 2.52 2.39 2.30 2.22 

oo 5.02 3.69 3.12 2.79 2.57 2.41 2.29 2.19 2.11 


有 用 的 统计 表 743 



















分 子 自由 度 
10 12 15 20 24 30 40 60 120 co 
1 968.6 976.7 984.9 993.1 997.2 1001 1006 1010 1014 1108 
2 39.40 39.41 39.43 39.45 39.46 39.46 39.47 39.48 39.49 39.50 
3 14.42 14.34 14.25 14.17 14.12 14.08 14.04 13.99 13.95 13.90 
4 8.84 8.75 8.66 8.56 8.51 8.46 8.41 8.36 8.31 8.26 
5 6.62 6.52 6.43 6.33 6.28 6.23 6.18 6.12 6.07 6.02 
6 5.46 5.37 5.27 5.17 5.12 5.07 5.01 4.96 4.90 4.85 
7 4.76 4.67 4.57 4.47 4.42 4.36 4.31 4.25 4.20 4.14 
8 4.30 4.20 4.10 4.00 3.95 3.89 3.84 3.78 3. 73 3.67 
9 3.96 3.87 3.77 3.67 3.61 3.56 3.51 3.45 3.39 3.33 
10 3.72 3.62 3.52 3.42 3.37 3.31 3.26 3.20 3.14 3.08 
11 3.53 3.43 3.33 3.23 3.17 3.12 3.06 ` 3.00 2.94 2.88 
12 3.37 3.28 3.18 3.07 3.02 2.96 2.91 2.85 2.79 2.72 
13 3.25 3.15 3.05 2.95 2.89 2.84 2.78 2.72 2.66 2.60 
14 3.15 3.05 2.95 2.84 2.79 2.73 2.67 2.61 2.55 2.49 
15 3.06 2.96 2.86 2.76 2.70 2.64 2.59 2.52 2.46 2.40 
2 16 2.99 2.89 2.79 2.68 2.63 2.57 2.51 2.45 2.38 2.32 
5 17 2.92 2.82 2.72 2.62 2.56 2.50 2.44 2.38 2.32 2.25 
ñ 18 2.87 2.77 2.67 2.56 2.50 2.44 2.38 2.32 2.26 2.19 
度 19 2.82 2.72 2.62 2.51 2.45 2.39 2.33 2.27 2.20 2.13 
20 2.77 2.68 2.57 2.46 2.41 2.35 2.29 2.22 2.16 2.09 
21 2.73 2.64 2.53 2.42 2.37 2.31 2.25 2.18 2.11 2.04 
22 2.70 2.60 2.50 2.39 2.33 2.27 2.21 2.14 2.08 2.00 
23 2.67 2.57 2.47 2.36 2.30 2.24 2.18 2.11 2.04 1.97 
24 2.64 2.54 2.44 2.33 2.27 2.21 2.15 2.08 2.01 1.94 
25 2.61 2.51 2.41 2.30 2.24 2.18 2.12 2.05 1.98 1.91 
26 2.59 2.49 2.39 2.28 2.22 2.16 2.09 2.03 1.95 1.88 
27 2.57 2.47 2.36 2.25 2.19 2.13 2.07 2.00 1.93 1.85 
28 2.55 2.45 2.34 2.23 2.17 2.11 2.05 1.98 1.91 1.83 
29 2.53 2.43 2.32 2.21 2.15 2.09 2.03 1.96 1.89 1.81 
30 2.51 2.41 2.31 2.20 2.14 2.07 2.01 1.94 1.87 1.79 
40 2.39 2.29 2.18 2.07 2.01 1.94 1.88 1.80 1.72 1.64 
60 2.27 2.17 2.06 1.94 1.88 1.82 1.74 1.67 1.58 1.48 
120 2.16 2.05 194 1.82 1.76 1.69 1.61 1.53 1.43 1.31 
E: 2.05 1.94 1.83 1.71 1.64 1.57 1.48 1.39 











资料 来 源 :Merrington M. 
Vol. 33 ，pp. 73-88. Reproduced by permission of the Biometrika Trustees. 
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表 B. 12 上 分 布 的 百 分 位 点 , e =0. 01 
RE) 




















2 3 4 5 6 7 8 9 

1 4052 4999,5 5403 5625 5764 5859 5928 5982 6022 
2 98. 50 99. 00 99.17 99.25 99.30 99.33 99.36 99.37 99.39 
3 34.12 30. 82 29.46 28.71 28.24 27.91 27.67 27.49 27.35 
4 21.20 18.00 16. 69 15.98 15.52 15.21 14.98 14.80 14.66 
5 16.26 13.27 12. 06 11.39 10.97 10.67 10.46 10.29 10.16 
6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 
7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 
8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 
9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 
10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 
11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 
12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 
13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 
14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 
分 15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 
母 16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 
17 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68 
B 18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 
由 19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 
度 20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 
21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40 
22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 
23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30 
24 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 
25 7.71 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 
26 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18 
27 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15 
28 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12 
`29 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09 
30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 
40 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 
60 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 
120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 
x° 6.63 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41 





有 用 的 统计 表 745 

















(E) 

V2 10 12 15 20 24 30 40 60 120 œ 

1 6056 6106 6157 6209 6235 6261 6287 6313 6339 6336 
2 99.40 99.42 99.43 99.45 99.46 99.47 99.47 99.48 99.49 99.50 
3 27.23 27.05 26.87 26.69 26.60 26.50 26.41 26.32 26.22 26.13 
4 14.55 14.37 14.20 14.02 13.93 13.84 13.75 13.65 13.56 13.46 
5 10.05 9.89 9.72 9.55 9.47 9.38 9.29 9.20 9.11 9.02 
6 7.87 7.72 7.56 7.40 7.31 7.23 7.14 7.06 6.97 6.88 
7 6.62 6.47 6.31 6.16 6.07 5.99 5.91 5.82 5.74 5.65 
8 5.81 5.67 5.52 5.36 5.28 5.20 5.12 5.03 4.95 4.86 
9 5.26 5.11 4.96 4.81 4.73 4.65 4.57 4.48 4.40 4.31 
10 4.85 4.71 4.56 4.41 4.33 4.25 4.17 4.08 4.00 3.91 
11 4.54 4.40 4.25 4.10 4.02 3.94 3.86 3.78 3.69 3.60 
12 4.30 4.16 4.01 3.86 3.78 3.70 3.62 3.54 3.45 3.36 
13 4.10 3.96 3.82 3.66 3.59 3.51 3.43 3.34 3.25 3.17 
14 3.94 3.80 3.66 3.51 3.43 3.35 3.27 3.18 3.09 3.00 
分 15 3.80 3.67 3.52 3.37 3.29 3.21 3.13 3.05 2.96 2.87 
母 16 3.69 3.55 3.41 3.26 3.18 3.10 3.02 2.93 2.84 2.75 
17 3.59 3.46 3.31 3.16 3.08 3.00 2.92 2.83 2.75 2.65 
B 18 3.51 3.37 3.23 3.08 3.00 2.92 2.84 2.75 2.66 2.57 
由 19 3.43 3.30 3.15 3.00 2.92 2.84 2.76 2.67 2.58 2.49 
度 20 3.37 3.23 3.09 2.94 2.86 2.78 2.69 2.61 2.52 2.42 
21 3.31 3.17 3.03 2.88 2.80 2.72 2.64 2.55 2.46 2.36 
22 3.26 3.12 2.98 2.83 2.75 2.67 2.58 2.50 2.40 2.31 
23 3.21 3.07 2.93 2.78 2.70 2.62 2.54 2.45 2.35 2.26 
24 3.17 3.03 2.89 2.74 2.66 2.58 2.49 2.40 2.31 2.21 
25 3.13 2.99 2.85 2.70 2.62 2.54 2.45 2.36 2.27 2.17 
26 3.09 2.96 2.81 2.66 2.58 2.50 2.42 2.33 2.23 2.13 
27 3.06 2.93 2.78 2.63 2.55 2.47 2.38 2.29 2.20 2.10 
28 3.03 2.90 2.75 2.60 2.52 2.44 2.35 2.26 2.17 2.06 
29 3.00 2.87 2.73 2.57 2.49 2.41 2.33 2.23 2.14 2.03 
30 2.98 2.84 2.70 2.55 2.47 2.39 2.30 2.21 2.11 2.01 
40 2.80 2.66 2.52 2.37 2.29 2.20 2.11 2.02 1.92 1.80 
60 2.63 2.50 2.35 2.20 2.12 2.03 1.94 1.84 1.73 1.60 
120 2.47 2.34 2.19 2.03 1.95 1.86 1.76 1.66 1.53 1.38 
o6 2.32 2.18 2.04 1.88 1.79 1.70 1.59 1.47 1.32 1.00 


资料 来 源 : Merrington, M. , and Thompson, C. M. " Tables of percentage points of the inverted beta ( F) -distribution ” . Biometrika , 
1943, Vol. 33, pp. 73-88. Reproduced by permission of the Biometrika Trustees. 


表 B. 13 学 生化 极 差 9( p, v) 的 百 分 位 点 , a =0. 05 










2 3 4 5 6 7 8 9 10 11 





17.97 26.98 32.82 37.08 40.41 43.12 45.40 47.36 49.07 50.59 
6.08 8.33 9.80 10. 88 11.74 12.44 13.03 13.54 13.99 14.39 
4.50 5.91 6.82 7.50 8.04 8.48 8.85 9.18 9.46 9.72 
3.93 5.04 5.76 6.29 6.71 7.05 7.35 7.60 7.83 8.03 
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5 3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 7.17 
6 3.46 4.34 4.90 5.30 5.63 5.90 6.12 6.32 6.49 6.65 
7 3.34 4.16 4.68 5.06 5.36 5.61 5.82 6.00 6.16 6.30 
8 3.26 4.04 4.53 4.89 5.17 5.40 5.60 5.77 5.92 6.05 
9 3.20 3.95 4.41 4.76 5.02 5.24 5.43 5.59 5.74 5.87 
10 3.15 3.88 4.33 4.65 4.91 5.12 5.30 5.46 5.60 5.72 
11 3.11 3.82 4.26 4.57 4.82 5.03 5.20 5.35 5.49 5.61 
12 3.08 3.77 4.20 4.51 4.75 4.95 5.12 5.27 5.39 5.51 
13 3.06 3.73 4.15 4.45 4.69 4.88 5.05 5.19 5.32 5.43 
14 3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13 5.25 5.36 
15 3.01 3.67 4.08 4.37 4.60 4.78 4.94 5.08 5.20 5.31 
16 3.00 3.65 4.05 4.33 4.56 4.74 4.90 5.03 5.15 5.26 
17 2.98 3.63 4.02 4.30 4.52 4.70 4.86 4.99 5.11 5.21 
18 2.97 3.61 4.00 4.28 4.49 4.67 4.82 4.96 5.07 5.17 
19 2.96 3.59 3.98 4.25 4.47 4.65 4.79 4.92 5.04 5.14 
20 2.95 3.58 3.96 4.23 4.45 4.62 4.71 4.90 5.01 5.11 
24 2.92 3.53 3.90 4.17 4.37 4.54 4.68 4.81 4.92 5.01 
30 2.89 3.49 3.85 4.10 4.30 4.46 4.60 4.72 4.82 4.92 
40 2.86 3.44 3.79 4.04 4.23 4.39 4.52 4.63 4.73 4.82 
60 2.83 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65 4.73 
120 2.80 3.36 3.68 3.92 4.10 4.24 4.36 4.47 4.56 4.64 
c | 2.77 3.31 3.63 3.86 4.03 4.17 4.29 4.39 4.47 4.55 
; P 12 13 14 15 16 17 18 19 20 
I 51.96 53.20 54.33 55.36 56.32 57.22 58.04 58.83 59.56 
2 14.75 15.08 15.38 15.65 ° 15.91 16.14 16.37 16.57 16.77 
3 9.95 10.15 10.35 10.52 10.69 10.84 10.98 11.11 11.24 
4 8.21 8.37 8.52 8.66 8.79 8.91 9.03 9.13 9.23 
5 7.32 7.47 7.60 7.72 7.83 7.93 8.03 8.12 8.21 
6 6.79 6.92 7.03 7.14 7.24 7.34 7.43 7.51 7.59 
7 .6.43 6.55 6.66 6.76 6.85 6.94 7.02 7.10 7.17 
8 6.18 6.29 6.39 6.48 6.57 6.65 6.73 6.80 6.87 
9 5.98 6.09 6.19 6.28 6.36 6.44 6.51 6.58 6.64 
10 5.83 5.93 6.03 6.11 6.19 6.27 6.34 6.40 6.47 
1 5.71 5.81 5.90 5.98 6.06 6.13 6.20 6.27 6.33 
12 5.61 5.71 5.80 5.88 5.95 6.02 6.09 6.15 6.21 
13 5.53 5.63 5.71 5.79 5.86 5.93 5.99 6.05 6.11 
14 5.46 5.55 5.64 5.71 5.79 5.85 5.91 5.97 6.03 
15 5.40 5.49 5.57 5.65 5.72 5.78 5.85 5.90 5.96 
16 5.35 5.44 5.52 5.59 5.66 5.73 5.79 5.84 5.90 
17 5.31 5.39 5.47 5.54 5.61 5.67 5.73 5.79 5.84 





有 用 的 统计 表 747 














12 13 14 15 16 17 18 19 20 
v 
18 5.27 5.35 5.43 5.50 5.57 5.63 5.69 5.74 5.79 
19 5.23 5.31 5.39 5.46 5.53 5.59 5.65 5.70 5.75 
20 | 5.20 5.28 5.36 5.43 5.49 5.55 5.61 5.66 5.71 
24 5.10 5.18 5.25 5.32 5.38 5.44 5.49 5.55 5.59 
30 5.00 5.08 5.15 5.21 5.27 5.33 5.38 5.43 5.47 
40 4.90 4.98 5.04 5.11 5.16 5.22 5.27 5.31 5.36 
60 4.81 4.88 4.94 5.00 5.06 5.11 5.15 5.20 5.24 
120 4.71 4.78 4.84 4.90 4.95 5.00 5.04 5.09 » 5.13 
c 4.62 4. 68 4.74 4.80 4.85 4.89 4.93 4.97 5.01 







资料 来 源 : Biometrika Tables for Statisticians, Vol. I, 3rd ed. , edited by E. S. Pearson and H. O. Hartley. Cambridge : Cambridge Univer- 


sity Press, 1966. Reproduced by permission of Professor E. S. Pearson and the Biometrika Trustees. 


RB. 14 "HERE qp, v) 的 百 分 位 点 , a =0. 01 
















10 11 
1 90.03 135.0 164.3 185.6 202.2 215.8 227.2 237.0 245.6 253.2 
2 14.04 19.02 22.29 24.72 26.63 28.20 29.53 30.68 31.69 32.59 
3 8.26 10.62 12.17 13.33 14.24 15.00 15.64 16.20 16.69 17.13 
4 6.51 8.12 9.17 9.96 10.58 11.10 11.55 11.93 12.27 12.57 
5 5.70 6.98 7.80 8.42 8.91 9.32 9.67 9.97 10.24 10.48 
6 5.24 6.33 7.03 7.56 7.97 8.32 8.61 8.87 9.10 9.30 
7 4.95 5.92 6.54 7.01 7.37 7.68 7.94 8.17 8.37 8.55 
8 4.75 5.64 6.20 6.62 6.96 7.24 7.47 7.68 7.86 8.03 
9 4.60 5.43 5.96 6.35 6.66 6.91 7.13 7.33 7.49 7.65 
10 4.48 5.27 5.77 6.14 6.43 6.67 6.87 7.05 7.21 7.36 
11 4.39 5.15 5.62 5.97 6.25 6.48 6.67 6.84 6.99 7.13 
12 4.32 5.05 5.50 5.84 6.10 6.32 6.51 6.67 6.81 6.94 
13 4.26 4.96 5.40 5.73 5.98 6.19 6.37 6.53 6.67 6.79 
14 4.21 4.89 5.32 5.63 5.88 6.08 6.26 6.41 6.54 6.66 
15 4.17 4.84 5.25 5.56 5.80 5.99 6.16 6.31 6.44 6.55 
16 4.13 4.79 5.19 5.49 5.72 5.92 6.08 6.22 6.35 6.46 
17 4.10 4.74 5.14 5.43 5.66 5.85 6.01 6.15 6.27 6.38 
18 4.07 4. 70 5.09 5.38 5.60 5.79 5.94 6.08 6.20 6.31 
19 4.05 4.67 5.05 5.33 5.55 5.73 5.89 6.02 6.14 6.25 
20 4.02 4.64 5.02 5.29 5.51 5.69 5.84 5.97 6.09 6.19 
24 3.96 4.55 4.91 5.17 5.37 5.54 5.69 5.81 5.92 6.02 
30 3.89 4.45 4.80 5.05 5.24 5.40 5.54 5.65 5.76 5.85 
40 3.82 4.37 4.70 4.93 5.11 5.26 5.39 5.50 5.60 5.69 
60 3.76 4.28 4.59 4.82 4.99 5.13 5.25 5.36 5.45 5.53 
120 3.70 4.20 4.50 4.71 4.87 5.01 5.12 5.21 5.30 5.37 
oo 3.64 4.12 4.40 4.60 4.76 4.88 4.99 5.08 5.16 5.23 
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( 续 ) 
P 12 13 14 15 16 17 18 19 20 
— 260.0 266.23 271.8 271.0 281.8 286.3 290.0 294.3 298.0 
2 33.40 34.13 34.81 35.43 36.00 36.53 37.03 37.50 37.95 
3 17.53 17.89 18.22 18.52 18.81 19.07 19.32 19.55 19.77 
4 12.84 13.09 13.32 13.53 13.73 13.91 14. 08 14.24 14.40 
5 10.70 10.89 11.08 11.24 11.40 11.55 11.68 11.81 11.93 
6 9.48 9.65 9.81 9.95 10.08 10.21 10.32 10.43 10. 54 
7 8.71 8.86 9.00 9.12 9.24 9.35 9.46 9.55 9.65 
8 8.18 8.31 8.44 8.55 8.66 8.76 `8.85 8.94 9.03 
9 7.78 7.91 8.03 8.13 8.23 8.33 8.41 8.49 8.57 
10 7.49 7.60 7. 7.81 7.91 7.99 8.08 8.15 8.23 
" 7.25 7.36 7.46 7.56 7.65 7.73 7.81 7.88 7.95 
12 7.06 7.17 7.26 7.36 7.44 7.52 7.59 7.66 7.73 
13 6.90 7.01 7.10 7.19 7.27 7.35 7.42 7.48 7.55 
14 6.77 6.87 6.96 7.05 7.13 7.20 7.27 7.33 7.39 
15 6.66 6.76 6.84 6.93 7.00 7.07 7.14 7.20 7.26 
16 6.56 6.66 6.74 6.82 6.90 6.97 7.03 7.09 7.15 
17 6.48 6.57 6.66 6.73 6.81 6.87 6.94 7.00 7.05 
18 6.41 6.50 6.58 6.65 6.72 6.79 6.85 6.91 6.97 
19 6.34 6.43 6.51 6.58 6.65 6.72 6.78 6.84 6.89 
20 6.28 6.37 6.45 6.52 6.59 6.65 6.71 6.77 6.82 
24 6.11 6.19 6.26 6.23 6.39 6.45 6.51 6.56 6.61 
30 5.93 6.01 6.08 6.14 6.20 6.26 6.31 6.36 6.41 
40 5.76 5.83 5.90 5.96 6.02 6.07 6.12 6.16 6.21 
60 5.60 5.67 5.73 5.78 5.84 5.89 5.93 5.97 6.01 
120 5.44 5.50 5.56 5.61 5.66 5.71 5.75 5.79 5.83 
" 5.29 5.35 5.40 5.45 5.49 5.54 5.57 5.61 5.65 


资料 来 源 ; Biometrika Tables Jor Statisticians, Vol. I, 3d ed. , edited by E. S. Pearson and H. O. Hartley. Cambridge : Cambridge Univer- 
sity Press, 1966. Reproduced by permission of Professor E. S. Pearson and the Biometrika Trustees. 


A B.15 威 尔 科 克 森 秩 和 检验 的 临界 值 T 和 Ty: 独立 样本 
检验 统计 量 是 与 较 小 样本 关联 的 秩 和 ( 如 果 样 本 大 小 相等 ， 可 以 用 任意 一 个 的 秩 和 ) 
a. 20.025 单 侧 ; a =0.05 双 侧 





























n 
3 4 5 6 7 8 9 10 
n, _ L 

T. T| T, To, T, Tm T| T un TO] T. m [n m 
3 5 16| 6 18|6 217 23|7 26]|8 28|8 353]|9 3 
4 6 18 | Hl. 25 | I2. 28 | D. 32 | 33. 35 | 14. 38 | I5. 4| 16. A 
5 6 21 | 12. 28 | 18. 37 | 19 41 2 45 | 200. 49 | 22. s3 | 24. s 
6 7 235 | 2. 32 | 19. 4| | 26 52 | 28. 56 | 29. 601 | 3 65| 32 7 
7 7 26 | I3. 35 | 20 45 | 28 56 | 37. 6839 nla 78 | 43. sg 
8 8 28 | 14. 38 | 21. 49 | 22 601 | 3 73 | 49. 8 | 53 93 | s4 9 
9 S 3 15 41122. 53 3 6 | 4 78 |si 93 |6 108| 6 104 
lb |9 3|1 4 |24 56 39 70|l4 g 54 98 | 66 l| 79 131 
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(5) 
b. a= 20.05 单 侧 ; a 20. 10 双 侧 








T, Ty | T, Ty | T, Ty T, Tu T, T, f, L Ty T, Ty T, Ty 


6 15 7 17 7 20 8 22 9 24 9 27 10 29 11 31 
7 17 12 24 13 27 14 30 15 33 16 36 17 39 18 42 
7 20 13 27 19 36 20 40 22 43 24 46 25 50 26 54 
8 22 14 30 20 40 28 50 30 54 32 58 33 63 35 67 
9 24 15 33 22 43 30 54 39 66 41 71 43 76 46 80 
9 27 16 36 24 46 32 58 41 71 52 84 53 90 57 95 
10 29 17 39 25 50 33 63 43 76 54 90 66 105 | 69 111 
10 11 31 18 42 26 54 35 67 46 80 57 95 69 111 83 127 


资料 来 源 : Wilcoxon, F. , and Wilcox, R. A. “Some rapid approximate statistical procedures". 1964, pp. 20-23. Reproduced with the 


permission of American Cyanamid Company. 


A B.16 ” 威 尔 科 克 森 配对 符号 秩 检验 的 监 界 值 元 












































单 — BN 双 ^ n=5 n=6 n=7 n=8 n=9 n=10 
a=0.05 a=0.10 1 2 4 6 8 11 
a =0. 025 a =0.05 1 2 4 6 8 
a -0.01 a 20.02 0 2 3 5 
a =0. 005 a 20.01 0 2 3 
nzll n-12 n -13 n=14 n=15 n=16 
a=0.05 a=0.10 14 17 21 26 30 ` 36 
a =0. 025 a -0.05 11 14 17 21 25 30 
a =0.01 a =0. 02 7 10 13 16 20 24 
a =0. 005 a 20.01 5 7 10 13 16 19 
n =17 n=18 n=19 n=20 n=21 n=22 
a=0.05 a 20.10 41 47 54 60 68 75 
a =0. 025 a -0.05 35 40 46 52 59 66 
a 20.01 a 20.02 28 33 38 43 49 56 
a =0. 005 a -0.01 23 28 32 37 43 49 
n=23 n=24 n=25 n=26 n=27 n=28 
a =0. 05 a =0.10 83 92 101 110 120 130 
a =0. 025 a =0.05 73 81 90 98 107 117 
a 20.01 a =0. 02 62 69 77 85 93 102 
a =0. 005 a -0.01 55 61 68 76 84 92 
n=29 n=30 n=31 n=32 n=33 n=34 
a =0. 05 a =0. 10 141 152 163 175 188 201 
a =0. 025 a =0. 05 127 137 148 159 171 183 
a -0.01 a =0. 02 111 120 130 141 151 162 
a =0. 005 a =0.01 100 109 118 128 138 149 
n=35 n=36 n=37 n=38 n=39 
e =0. 05 a =0. 10 214 228 242 256 271 
a 20.025 a =0. 05 195 208 222 235 250 
a =0.01 a =0. 02 174 186 198 211 224 


a =0. 005 a=0.01 160 171 183 195 208 
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(AE) 
n-40 nz4l n-42 n =43 n=44 n=45 
a 20.05 a 20.10 287 303 319 336 353 371 
a =0. 025 a =0. 05 264 279 295 311 327 344 
a 0.01 a =0. 02 238 252 267 281 297 313 
a = 0. 005 a =0.01 221 234 248 262 277 292 
n =46 n=47 n=48 n=49 n=50 
a z0.05 a z0.10 389 408 f 427 446 466 
a = 0. 025 a =0.05 361 379 397 415 434 
a =0.01 a =0. 02 329 345 362 380 398 
a =. 005 a -0.01 307 323 339 356 373 


资料 来 源 : Wileoxon, F. , and Wilcox, R. A. "Some rapid approximate statistical procedures. "1964, p.28. Reproduced with the per- 


mission of American Cyanamid Company. 


X B.17 斯 皮尔 曼 秩 相关 系数 的 临界 值 
相应 于 Ho: p, =0 的 单 侧 检 验 的 a 值 . 对 双 侧 检验 ,应 将 这 个 值 加 倍 . 

















n a =0.05 0.025 e =0.01 a =0. 005 n a 0.05 0. 025 a —-0.01 a =0. 005 
5 0. 900 — 一 一 18 0.399 0.476 0.564 0. 625 
6 0. 829 0. 886 0. 943 — 19 0. 388 0. 462 0. 549 0. 608 
7 0. 714 0. 786 0. 893 — 20 0. 377 0. 450 0. 534 0. 591 
8 0. 643 0. 738 0. 833 0. 881 21 0. 368 0. 438 0. 521 I 0.576 
9 0. 600 0. 683 0. 783 0. 833 22 0. 359 0. 428 0. 508 0. 562 
10 0. 564 0. 648 0. 745 0. 794 23 0. 351 0. 418 0. 496 0. 549 
11 0.523 0. 623 0. 736 0. 818 24 0. 343 0. 409 0. 485 0. 537 
12 0. 497 0. 591 0. 703 0. 780 25 0. 336 0. 400 0. 475 0. 526 
13 0. 475 0. 566 0. 673 0. 745 26 0. 329 0. 392 0. 465 0. 515 
14 0.457 0. 545 0. 646 0. 716 27 0. 323 0. 385 0. 456 0. 505 
15 0. 441 0. 525 0. 623 0. 689 28 0.317 0. 377 0. 448 0. 496 
16 0. 425 0. 507 0. 601 0. 666 29 0.311 0. 370 0. 440 0. 487 
17 0. 412 0. 490 0. 582 0. 645 30 0. 305 0. 364 0. 432 0. 478 





资料 来 源 :0lds，E. C. “Distribution of sums of squares of rank differences for small samples". Annals of Mathematical Statistics, 1938 , 
p. 9. Reproduced with the permission of the Editor, Annals of Mathematical Statistics. 


RB. 18 素 尔 零 斜 率 检验 C 的 临界 值 


n 





x 4 5 .8 9 12 13 16 17 20 

0 0.625 0. 592 0. 548 0. 540 0. 527 0. 524 0.518 0. 516 0. 513 
2 0. 375 0. 408 0. 452 0. 460 0. 473 0. 476 0. 482 0. 484 0. 487 
4 0. 167 0. 242 0. 360 0.381 0. 420 0. 429 0. 447 0. 452 0. 462 
6 0.042 0.117 0.274 0. 306 0. 369 0. 383 0. 412 0. 420 0. 436 
8 0. 042 0. 199 0. 238 0. 319 0. 338 0. 378 0. 388 0.411 


10 0. 008 0. 138 0. 179 0. 273 0. 295 0. 345 0. 358 0. 387 
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(E) 

x 4 8 9 12 13 16 17 20 
12 0.089 0.130 0.230 0.255 0.313 0.328 0.362 
14 0.054 0.090 0.190 0.218 0.282 0.299 0.339 
16 0.031 0.060 0.155 0.184 0.253 0.271 0.315 
18 0.016 0.038 0.125 -0.153 0.225 0.245 0.293 
20 0.007 0.022 0.098 0.126 0.199 0.220 0.271 
22 0.002 0.012 0.076 0.102 0.175 0.196 0.250 
24 0.001 0.006 0.058 0.082 0.153 0.174 0.230 
26 0.000 0.003 0.043 0.064 0.133 0.154 0.211 
28 0.001 0.031 0.050 0.114 0.135 0.193 
30 0.000 0.022 0.038 0.097 0.118 0.176 
32 0.016 0.029 0.083 0.102 0.159 
34 0.010 0.021 0.070 0.088 0.144 
36 0.007 0.015 0.058 0.076 0.130 
38 0.004 0.011 0.048 0.064 0.117 
40 0.003 0.007 0.039 0.054 0.104 
42 0.002 0.005 0.032 0.046 0.093 
44 0.001 0.003 0.026 0.038 0.082 
46 0.000 0.002 0.021 0.032 0.073 
48 0.001 0.016 0.026 0. 064 
50 0.001 0.013 0.021 0.056 
52 0. 000 0.010 0.017 0.049 
54 0.008 0.014 0.043 
56 0.006 0.011 0.037 
58 0.004 0. 009 0.032 
60 0.003 0.007 0.027 
62 0.002 0.005 0. 023 
64 0.002 0.004 0.020 
66 0.001 0.003 0.017 
68 0.001 0.002 0.014 
70 0.001 0.002 0.012 
72 0. 000 0.001 0.010 
74 0.001 0. 008 
76 0.001 0. 007 
78 0. 000 0. 006 
80 0. 005 
82 0. 004 
84 0.003 
86 0.002 
88 0.002 
90 0.002 
92 0.001 
94 0.001 
96 0.001 
98 0.001 
100 0.000 














752 附录 B 
( 续 ) 
n 

x 21 24 25 28 29 32 33 36 37 40 

0 0.512 — 0.510 | 0.509 0.508 0.507 0.506 0.506 0.505 0.505 0. 505 

2 0.488 0.490 0.491 049 0.493 0.494 — 0.494 — 0.495 0.495 0. 495 

4 0.464 0.471 0.4722 0.471 0.478 0. 481 0.482 0.484 0.484 0. 486 

6 0.441 0.451 0.454 0.461 0.463 0.468 0.469 0.473 0.474 0.477 

8 0.417 0.432 0.436 0.446 0.448 0.455 0.457 0.462 0.464 0.468 
10 0.394 0.413 0418 0430 0434 0442 0.445 0.452 0.453 0. 459 
12 0.371 0.394 — 0.400 0.415 049 0.430 0.433 0.441 0.443 0.449 
14 0.349 — 0.375 0.382 0.400 0.405 0417 0.421 0.430 — 0.433 0. 440 
16 0.327 . 0.356 . 0.364 0.385 0.390 0.405 0.409 0.400 0.423 0.431 
18 0.306 — 0.338 — 0.347 0.370 0.376 0.39 — 0.397 0.409 — 0.413 0. 422 
20 0.285 — 0.320 — 0.330 . 0.355 0.362 0.380 0.385 0.399 0.403 0. 413 
22 0.265 0.303 0.314 0.341 0.348 0.368 0.373 0.388 — 0.393 0. 404 
24 0.246 — 0.286 . 0.297 0.3206 0.334 0.356 0.362 0. 378 0. 383 0. 395 
26 0.228 — 0.270 0.282 0.312 0.321 0.344 0.350 — 0.368 0.373 0. 386 
28 0.210 — 0.254 0.266 0.298 0.308 0.332 0.339 0. 358 0. 363 0.377 
30 019 0.238 0251 0.285 0.295 0.320 — 0.328 0.347 — 0.353 0.369 
32 0177 20.23 0.237 0.272 0.282 0.309 0.317 0. 338 0.344 0.360 
34 0.162 0.209 — 0.222 0.259 0.270 0.298 0306 038 — 0.334 0.351 
36 0.147 — 0.195 — 0.200 0.246 — 0.257 0.287 0.295 0.318 — 0.325 0. 343 
38 0.134 — 0.181 0.196 — 0.234 0.246 0.276 0.28 0.308 0.315 0. 334 
40 0. 121 0.169 — 0.183 0.222 0.234 0.265 0.274 0.299 — 0.306 0. 326 
42 0.100 — 0.156 0.171 0.211 0. 223 0. 255 0.264 — 0.290 — 0.297 0.318 
44 0.008 — 0.145 0.159 | 0.200 0.212 0.244 0.254 020 0.288 0.309 
46 0.088 0.134 0.148 0.189 0.201 0.224 0.244 0.271 0.279 0.301 
48 0.079 0.123 0.18 0.178 0.191 0.24 0.235 0.262 | 0.271 0. 293 
50 0.070 — 0.113 0.128 — 0.168 0.181 0215 — 0.225 0.254 0.262 0. 285 
52 0.062 — 0.104 — 0.118 0.158 — 0.171 0.206 0.216 0.245 0.254 0.277 
54 0.055 | 0.005 0.10 0.149 0.162 0.197 0.207 0.237 — 0.245 0. 270 
56 0.049 — 0.087 0.101 0.140 0.153 0.188 — 0.199 0.228 | 0.237 0. 262 
58 0.003 | 0.079 0.009 0.131 0.144 0.179 0.1900 0.220 0.229 0.255 
60 0.007 | 0.0722 0.08 013 016 017 0.182 — 0.212 0.222 0. 247 
62 0032 0.066 | 0.078 0.115 — 0.128 0.163 — 0.174 0.200 0.214 0. 240 
64 0.008 |— 0.059 — 0.07 0.108 — 0.120 — 0.155 — 0.166 0.197 0.206 0. 233 
66 0.000 — 0.054 0.065 0.101 0.112 0.147 0.158 0.189 — 0.199 0. 226 
68 0.021 0.008 — 0.059 — 0.094 0.105 0.140 — 0.151 0.182 — 0.192 0.219 
70 0.018 — 0.044 0014 0.087 0.099 0.133 — 0.144 . 0.175 0.185 0.212 
72 0.005 — 0.039 0.049 0.081 002 — 0.126 0.137 0. 168 0. 178 0. 205 
74 0.013 — 0.035 — 0.044 — 0.075 0.086 — 0.119 0.130 0.161 0.171 0. 199 
76 0.011 0.031 0.000 — 0.070 — 0.080 — 0.113 — 0.124 — 0.155 0.165 0. 192 
78 0.000 — 0.028 | 0.036 | 0.065 0.05 0.107 0.117 0. 148 0. 158 0. 186 
80 0.008 0.025 — 0.032 0.060 000 0101 0. 111 0.142 0.152 0. 180 
82: 0.007 — 0.022 0.029 | 0.055 — 0.065 0.005 — 0.106 0.136 0.146 0. 174 
84 0.0 0.019 0.026 0.051 0.000 — 0.000 — 0.100 — 0.130 0.140 0. 168% 
86 0. 005 0.017 — 0.03 0.047 0.056 0.085 0.095 0.124 0.134 0. 162 




















有 用 的 统计 表 753 
( 续 ) 
TC 
> 21 24 25 28 29 32 33 36 37 40 
88 0.004 0.015 0.021 0.043 0.052 0. 080 0.090 0.119 0.129 0.156 
90 0.003 0.013 0.018 0.039 0.048 0.075 0.085 0.114 0.123 0.151 
92 0.002 0.011 0.016 0.036 0.044 0.070 0.080 0.108 0. 118 0. 146 
94 0. 002 0.010 0.014 0.033 0.041 0.066 0.075 0.103 0.113 0.140 
96 0.002 0.009 0.013 0.030 0.037 0.062 0.071 0. 099 0. 108 0. 135 
98 0. 001 0.007 0.011 0.027 0.034 0.058 0.067 0.094 0.103 0.130 
100 0.001 0.006 0.010 0.025 0.031 0.054 0.063 0. 089 0. 098 0. 125 
n 
x 6 7 10 11 14 15 18 19 22 
1 0. 500 0. 500 0. 500 0. 500 0. 500 0. 500 0.500 0.500 0.500 
3 0.360 0.386 0.431 0.440 0.457 0.461 0.470 0.473 0.478 
5 0.235 0.281 0.364 0.381 0.415 0.423 0.441 0.445 0.456 
7 0.136 0.191 0.300 0.324 0.374 0.385 0.411 0.418 0.434 
9 0.068 0.119 0.242 0.271 0.334 0.349 0.383 0.391 0.412 
11 0.028 0.068 0.190 0.223 0.295 0.313 0.354 0.365 0.390 
13 0.008 0.035 0.146 0.179 0.259 0.279 0.327 0.339 0.369 
15 0.001 0.015 0.108 0.141 0.225 0.248 0.300 0.314 0.348 
17 0.005 0.078 0.109 0.194 0.218 0.275 0.290 0.328 
19 0.001 0.054 0.082 0.165 0.190 0.250 0.267 0.308 
21 0.000 0.036 0.060 0.140 0.164 0.227 0.245 0.289 
23 0.023 0.043 0.117 0.141 0.205 0.223 0.270 
25 0.014 0.030 0.096 0.120 0.184 0.203 0.252 
27 0. 008 0.020 0.079 0. 101 0.165 0.184 0.234 
29 0.005 0.013 0.063 0.084 0.147 0.166 0.217 
31 0.002 0.008 0.050 0.070 0.130 0.149 0.201 
33 0.001 0.005 0.040 0.057 0.115 0.133 0.186 
35 0.000 0.003 0.031 0.046 0.100 0.119 0.171 
37 0.002 0.024 0.037 0.088 0.105 0.157 
39 0.001 0.018 0.029 0.076 0.093 0.144 
41 0.000 0.013 0.023 0.066 0.082 0.131 
43 0.010 0.018 0.056 0.072 0.120 
45 0.007 0.014 0.048 0.062 0.109 
47 0.005 0.010 0.041 0.054 0.099 
49 0.003 0.008 0.034 0.047 0.089 
51 0.002 0.006 0.029 0.040 0.080 
53 0.002 0.004 0.024 0.034 0.072 
55 0.001 0.003 0.020 0.029 0.064 
57 0.001 0.002 0.016 0.025 0.058 
59 0.000 0.001 0.013 0.021 0.051 
61 0.001 0.011 0.017 0.045 
63 0.001 0.009 0.014 0.040 
65 0.000 0.007 0.012 0.035 
67 0.005 0.010 0.031 
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x 6 7 10 16 14 15 18 19 22 
69 0.004 0. 008 0.027 
7 0.003 0. 006 0.024 
73 0.003 0.005 0.021 
75 0.002 0.004 0.018 
T] 0. 001 0. 003 0.015 
79 0.001 0. 003 0.013 
81 0.001 0. 002 0.011 
83 0.001 0.002 0.010 
85 0. 000 0. 001 0. 008 
87 0.001 0.007 
89 0.001 0. 006 
91 0.001 0.005 
93 0.000 0.004 
95 0. 003 
97 0.003 
99 0. 002 
101 0.002 

x 23 26 27 30 31 34 35 38 39 
1 0. 500 0. 500 0. 500 0. 500 0. 500 0. 500 0. 500 0. 500 0. 500 
3 0. 479 0. 483 0. 484 0. 486 0. 487 0. 488 0. 489 0. 490 0. 490 
5 0. 458 0. 465 0. 467 0. 472 0. 473 0. 477 0. 478 0. 480 0. 481 
7 0. 438 0. 448 0. 451 0. 458 0. 460 0. 465 0. 466 0. 470 0. 472 
9 0. 417 0. 431 0. 434 0. 444 0. 446 0. 453 0. 455 0. 460 0. 462 
11 0.397 0.414 0.418 0.430 0.433 0.442 0.444 0.450 0.452 
13 0.377 0. 397 0.402 0.416 0.420 0.430 0.433 0.440 0.443 
15 0. 357 0. 380 0. 386 0. 402 0. 407 0. 418 0. 422 0. 431 0. 433 
17 0. 338 0. 363 0.371 0. 389 0. 394 0. 407 0. 411 0. 421 0. 424 
19 0. 319 0. 347 0. 355 0. 375 0. 381 0. 396 0. 400 0.411 0.414 
21 0. 301 0. 331 0. 340 0. 362 0. 368 0. 384 0. 389 0. 401 0. 405 
23 0. 283 0. 316 0. 325 0. 349 0. 355 0. 373 0. 378 0. 392 0. 396 
25 0. 265 0. 300 0. 310 0. 336 0. 343 0. 362 0. 368 0. 382 0. 387 
27 0. 248 0. 285 0. 296 0. 323 0. 331 0. 351 0. 357 0. 373 0. 377 
29 0. 232 0. 270 0. 281 0.310 0.318 0. 340 0. 347 0. 363 0. 368 
31 0. 216 0. 256 0. 268 0. 298 0. 306 0. 329 0. 336 0. 354 0. 359 
33 0. 201 0. 242 0. 254 0. 286 0. 295 0. 319 0. 326 0. 345 0. 350 
35 0. 187 0. 229 0. 241 0.274 0. 283 0. 308 0. 316 0. 336 0.341 
37 0. 173 0. 216 0. 228 0. 262 0.272 0. 298 0. 306 0. 327 0. 333 
39 0. 160 0. 203 0.216 0. 251 0. 261 0. 288 0. 296 0.318 0. 324 
41 0.147 0. 191 0. 204 0. 239 0. 250 0. 278 0. 286 0. 309 0. 315 
43 0. 135 0. 179 0.192 0. 228 0. 239 0. 268 0. 277 0. 300 0. 307 
45 0. 124 0. 168 0. 181 0. 218 0. 229 0. 259 0. 267 0. 29] 0. 298 
47 0. 114 0. 157 0. 170 0. 208 0. 219 0. 249 0. 258 0. 283 0. 290 
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x 23 26 27 30 31 34 35 38 39 

49 0. 104 0. 147 0.160 0.198 0.209 0.240 0.249 0.274 0. 282 
51 0. 094 0. 137 0. 150 0. 188 0. 199 0. 231 0. 240 0. 266 0. 274 
53 0. 086 0. 127 0. 141 0. 178 0. 190 0. 222 0. 232 0. 258 0. 266 
55 0. 078 0. 118 0. 132 0. 169 0. 181 0. 213 0. 223 0. 250 0. 258 
57 0. 070 0. 110 0. 123 0. 160 0.172 0. 205 0.215 0. 242 0. 250 
59 0. 063 0. 102 0. 115 0. 152 0. 164 0. 196 0. 206 0. 234 0. 243 
61 . 0. 057 0. 094 0. 107 0.144 0. 155 0. 188 0. 198 0.227 0.235 
63 0.051 0. 087 0. 099 0. 136 0. 147 0. 180 0. 191 0. 219 0. 228 
65 0. 046 0. 080 0. 092 0. 128 0. 140 0. 173 0. 183 0.212 0. 221 
67 0. 041 0. 073 0. 085 0. 121 0. 132 0. 165 0. 176 0. 205 0. 214 
69 0. 036 0. 067 0. 079 0. 114 0. 125 0. 158 0. 168 0. 198 0. 207 
71 0. 032 0. 062 0. 073 0. 107 0. 118 0.151 0.161 0.191 0.200 
73 0.028 0. 057 0.067 0. 100 0. 112 0. 144 0. 154 0. 184 0. 193 
75 0. 025 0. 052 0. 062 0. 094 0. 105 0. 137 0. 148 0.177 0. 187 
77 0.022 0. 047 0. 057 0. 088 0. 099 0. 131 0. 141 0. 171 0. 180 
79 0. 019 0. 043 0. 052 0. 083 0. 093 0. 125 0. 135 0. 165 0. 174 
81 .0. 017 0. 039 0. 048 0. 077 0. 088 0. 119 0. 129 0. 158 0. 168 
533 0. 015 0. 035 0. 044 0.072 0. 082 0. 113 0. 123 0. 152 0. 162 
85 0. 013 0. 032 0. 040 0. 067 0. 077 0. 107 0. 117 0. 147 0. 156 
87 0.011 0. 029 0. 036 0. 063 0. 072 0. 102 0. 112 0. 141 0. 150 
89 0. 009 0. 026 0. 033 0. 059 0. 068 0. 097 0. 107 0. 135 0. 145 
91 0. 008 0. 023 0. 030 0. 054 0. 063 0. 092 0. 101 0. 130 0. 139 
93 0. 007 0.021 0. 027 0. 051 0. 059 0. 087 0. 096 0. 125 0. 134 
95 0. 006 0. 019 0. 025 0. 047 0. 055 0. 082 0. 092 0. 120 0. 129 
97 0. 005 0. 017 0. 022 0. 043 0. 052 0. 078 0. 087 0. 115 0. 124 
99 0. 004 0. 015 0. 020 0. 040 0. 048 0. 074 0. 083 0. 110 0. 119 








样本 中 的 观测 值 个 数 均 值 图 极 X 图 
n A, d, ds D, D, 
2 1. 880 1. 128 0. 853 0 3.276 
3 1.023 1. 693 0. 888 0 2.575 
4 0. 729 2.059 0. 880 0 2.282 
5 0.577 2.326 0. 864 0 2.115 
6 0. 483 2.534 0. 848 0 2. 004 
7 0.419 2. 704 0. 833 0.076 1. 924 
8 0. 373 2.847 0. 820 0. 136 1. 864 
9 0. 337 2. 970 "0. 808 0. 184 1.816 ^ 
10 0. 308 3. 078 0. 797 0. 223 1.777 
11 0. 285 3. 173 0.787 0.256 1.744 
12 0.266 3.258 0.778 0.284 1.719 
13 0.249 3.336 0.770 0.308 1.692 
14 0.235 3.407 0.762 0.329 1.671 
15 0.223 3.472 0.755 0.348 1.652 
16 0.212 3.532 0.749 0.364 1.636 
17 0.203 3. 588 Ó. 743 0.379 1.621 
18 0. 194 3. 640 0. 738 0. 392 1. 608 
19 0. 187 3. 689 0. 733 0. 404 1. 596 
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样本 中 的 观测 值 个 数 | 

n A; d, d, D, D, 
20 0. 180 3. 735 0. 729 0.414 1. 586 
21 0. 173 3. 778 0. 724 0. 425 1.575 
22 0. 167 3. 819 0. 720 0. 434 1. 566 
23 0. 162 3. 858 0. 716 0. 443 1.557 
24 0. 157 3. 895 0. 712 0. 452 1. 548 
25 1 


资料 来 源 : ASTM Manual on Quality Control of Materials, American Society for Testing Materials, Philadelphia, PA, 19* 1. Copyright 
ASTM. Reprinted with permission. 


AX B.20 正 态 分 布 容 许 限 的 KK 值 


























n. 0.90 0.95 0.99 0.90 0.95 0.95 
2 32.019 37.674 48.430 160.193 188.491 242.300 
3 8.380 9.916 12. 861 18.930 22.401 29. 055 
4 5.369 6.370 8.299 9.398 11.150 14.527 
5 4.275 5.079 6.634 6.612 7.855 10. 260 
6 3.712 4.414 5.775 5.337 6.345 8.301 
7 3.369 4.007 5.248 4.613 5.488 7.187 
8 3.136 3.732 4.891 4.147 4.936 6.468 
9 2.967 3.532 4.631 3.822 4.550 5.996 
10 2.839 3.379 4.433 3.582 4.265 5.594 
11 2.737 3.259 4.277 3.397 4.045 5.308 
12 2.655 3.162 4.150 3.250 3.870 5.079 
13 2.587 3.081 4.044 3.130 3.727 4.893 
14 2.529 3.012 3.955 3.029 3.608 4.737 
15 2.480 2.954 3.878 2.945 3.507 4.605 
16 2.437 2.903 3.812 2.872 3.421 4.492 
17 2.400 2.858 3.754 2.808 3.345 4.393 
18 2.366 2.819 3.702 2.753 3.279 4.307 
19 2.337 2.784 3.656 2.703 3.221 4.230 

20 2.310 2.752 3.615 2.659 3.168 4.161 
25 2.208 2.631 3.457 2.494 2.972 3.904 
30 2.140 2.549. 3.350 2.385 2.841 3.733 
35 2.090 2.490 3.272 2.306 2.748 3.611 
40 2.052 2.445 3.213 2.247 2.677 3.518 
45 2.021 2.408 3.165 2.200 2.621 3.444 
50 1.996 2.379 3.126 2.162 2.576 3.385 
55 1.976 2.354 3.094 2.130 2.538 3.335 
60 1.958 2.333 3.066 2.103 2.506 3.293 
65 1.943 2,315 3.042 2.080 2.478 3.257 
70 1.929 2.299 3.021 2.060 2.454 3.225 
75 1.917 2.285 3.002 2.042 2.433 3.197 
80 1.907 2.272 2.986 2.026 2.414 3.173 
85 ` 1. 897 2.261 2.971 2.012 2.397 3.150 
90 1.889 2.251 2.958 1.999 2.382 3.130 
95 1.881 2.241 2.945 1.987 2.368 3.112 
100 1.874 2.233 2.934 1.977 2.355 3.096 
150 1.825 2.175 2.859 1.905 2.270 2. 983 
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资料 来 源 :Technigques of Statistical Analysis by C. Fisenhart, M. W. Hastay, and W. A. Wallis. Copyright 1947 , MeGraw-Hill Book Com- 
pany, Inc. Reproduced with permission of MeGraw-Hill. 


表 B. 21 非 参 数 容许 限 的 样本 大 小 n 
l-a 














y ] 0.50 07 [| 0.90 0.95 0.99 0.995 
0.995 336 488 777 947 1325 1483 
0.99 168 244 388 473 662 740 
0.95 34 49 77 93 130 146 
0.90 17 24 38 46 64 72 
0.85 11 16 25 30 42 47 
0.80 9 12 18 22 31 34 
0.75 7 10 15 18 24 27 
0.70 6 8 12 14 20 22 
0.60 4 6 9 10 14 16 
0.50 3 5 7 8 1 12 











资料 来 源 : Tables A-25d of Wilfrid J. Dixon and Frank J. Massey , Jr. , Introduction to Statistical Analysis, 3rd ed. , McGraw-Hill Book 
Company , New York ,1969. Used with Permission of McGraw-Hill Book Company. 


表 B. 22 样本 大 小 字 码 :MIL-STD-105D 


特殊 检查 水 平 一 般 检 查 水 平 
批量 大 小 $4 82 $3 
2-8 

9 -15 

16 -25 

26 ~50 

51 -90 

91 ~150 

151 ~ 280 

281 ~ 500 

501 ~ 1200 
1201 ~ 3200 
3201 ~ 10000 
10001 ~ 35000 
35001 ~ 150000 
150001 ~ 500000 


500001 及 以 上 Q 
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附录 C SAS 的 视窗 指导 


C.1 SAS 的 视窗 环境 


HA SAS 界面 时 ， 你 将 看 到 一 个 类 似 于 图 C. 1 的 屏幕 . 屏幕 底部 的 窗口 是 SAS 编辑 器 窗口 . 
建立 和 分 析 数 据 的 SAS 程序 命令 在 这 个 窗口 中 指 
定 . 屏幕 顶部 的 窗口 是 SAS 日 志 窗 口 , 它 记 录 了 每 
个 指令 行 是 否 成 功 执行 . 一 旦 运行 了 一 个 程序 , 就 
会 出 现 第 三 个 窗口 一 一 SAS 输出 窗口 , 这 个 窗口 将 

显示 分 析 的 结果 , 本 书 中 给 出 的 SAS 打印 结果 都 
出 现在 SAS 输出 窗口 中 . 


C.2 创建 一 个 准备 分 析 的 SAS 数据 集 


在 SAS 编辑 窗口 ， 可 以 利用 三 种 基本 指令 
"m AE 3382. 数据 怎样 登录 的 指令 图 C.1 SAS 用 户 看 到 的 初始 屏幕 

2. 输入 数据 值 ; 数据 集合 中 变量 的 值 . 

3. 统计 过 程 指令 (PROC) : 对 数据 进行 类 型 分 析 的 指令 . 

图 C. 2 所 示 的 命令 创建 并 打印 名 为 FTC 的 SAS 数据 集 , 它 是 FISHDDT 数据 文件 的 一 个 子 集 . 
SAS 的 变量 名 (如 SPECIES) Fife INPUT 命令 中 . (iR: 定性 变量 名 跟 在 一 个 美元 符号 后 . ) 输入 的 数 
据 值 必须 直接 融入 ( 台 或 复制 ) 编辑 窗 | H. 











ATION $ MILE SPECIES HAF 












4. LENGTH WEIGHT DDT; 





CHANNELCATFISH 
ELCATFISH 
NELCATFISH 
1 CHANNELCATFISH 
75 CHANNELCATFISH 
HANNELCATFISH 

NELCATFISH 

LMOUTHBUFF 
VELCATFISH 
HANNELCATF ISH 
ARGEMOUTHBASZS 








UU UU firm 
图 C.2 创建 并 打印 数据 集 的 SAS 命令 
如 果 数 据 保存 在 一 个 外 部 数据 文件 中 ( 如 FISHDDT 数据 集 那 样 ), 你 可 以 利用 INFILE 命令 访问 它 , 这 
由 图 C. 3 阐述 .( 注 : 图 C.3 中 的 程序 也 表明 了 怎样 利用 乘法 标准 符号 * 创建 交互 作用 项 和 平方 项 . ) 
为 了 实际 提交 SAS 程序 (并 在 输出 窗口 得 到 结果 ), 需要 单 击 SAS 屏幕 项 部 菜单 条 上 显示 的 
“Run” 按钮 . ( 见 图 C. 3. ) 
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C.3 利用 SAS 分 析 员 


对 SAS 程序 命令 不 熟悉 的 SAS H, SAS 有 一 个 称 作 SAS 分 析 员 的 “用 户 友好 ”菜单 界 
HI. 在 SAS 分 析 员 中 , 不 需要 知道 任何 SAS 命令 ,简单 地 单 击 合适 的 菜单 选项 就 可 以 得 到 
结果 . 

在 已 经 指定 了 想 要 分 析 的 SAS 数据 集 之 后 ( 见 C. 2 节 ) , 单 击 SAS 菜单 栏 上 的 “Solution” 按 
钮 进入 分 析 员 会 话 , 然后 单 击 “ Analysis" , 然后 单 击 “ Analyst" ( 见 图 C. 4), 得 到 图 C. 5 所 示 的 
屏幕 . 

注意 图 C. 5 给 出 了 一 个 空 “ 数 据 表 ”. 把 想 要 利用 SAS 分 析 员 进行 分 析 的 数据 放 入 表 中 , 需要 单 
idi SAS 菜单 栏 上 的 “File” 按 钮 ,然后 单 击 “Open by SAS Name”, 然后 单 击 “Work”, 最 后 单 击 你 在 编 
辑 窗口 利用 SAS 命令 创建 的 SAS 数据 (例如 FTC) 的 名 称 . 现在 这 个 数据 表 包 括 了 数据 集 的 值 . ( 见 图 
C.6. ) 

一 旦 以 这 种 方式 访问 数据 , 就 准备 好 了 利用 SAS 分 析 员 的 菜单 驱动 特征 来 分 析 它 . 


4. LENGTH WEIGHT DOT; 
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5; CHANNELCATFISH 45 547 

5 CHANNELCATFISH 39 4£5 
5 CHANNELCATFISH 505 1252. 5 
5; CHANNELCATFISH 52 1255 15 
3 CHANNELCATFISH 405 741 Æ 
t 3 CHANNELCATFISH 48 1151 ?7 
£ 3 CHANNELCATFISH 48 1195 < 
c 3 CHANNELCATFISH 435 754 1° 
t 3 CHANNELCATFISH 405 679 1E 
£ 3; CHANNELCATFISH 475 385 54 
t 1 CHANNELCATFISH 445 1133 2€ 
C T; CHANNELCATFISH 46 1138 31 
T; CHANNELCATFISH 49. 1185 3t 
1 CHANNELCATFISH 45 384 81 
1 CHANNELCATFISH 43 465 7E 
1 CHANNELCATFISH 45 1084 41 
275 CHANNELCATFISH 48 386 B4 
275 CHANNELCATFISH 45 1023 1E 





275 CHANNELCATFISH 48 1266 2 
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图 C.5 SAS 分 析 员 会 话 的 初始 屏幕 C.6 SAS 分 析 员 中 的 数据 表 


C.4 数据 列表 


为 利用 SAS 分 析 员 得 到 数据 列表 ( 打印 输出 ) , 单 击 分 析 员 菜单 栏 上 的 “Report” 按 钮 , 然后 单 击 
"List Data” 按 钮 ( 见 图 C.7). 图 C. 8 显示 了 随后 得 到 的 菜单 , RINKE. 


SAS 的 视窗 指导 761 




































5 LENGTH | 
Y SAS - [Analyst [new prolect]] HEIGHT pad P 
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图 C.7 得 到 数据 列表 的 SAS 分 析 员 选项 图 C.8 数据 列表 对 话 杠 


把 想 要 打印 的 变量 的 名 输入 "Print” 框 ( 简单 地 单 击 那个 变量 即 可 ) ， 然 后 单 击 ”OK”， 打 印 输出 
就 显示 在 你 的 屏幕 上 . 


C.5 图 示 数 据 
为 利用 SAS 分 析 员 得 到 数据 的 图 形 描述 (例如 ,条 形 图 、 直 方 图 、 散 点 图 等 ), 单 击 分 析 员 菜单 
栏 上 的 “Graph” 按 钮 ( 见 图 C. 9). 得 到 的 菜单 列表 如 图 C.9 所 示 . 本 书 中 涉及 的 4 个 选项 是 :“ 条 形 


图 " “直方 图 "、“( 正 态 ) 概 率 图 ”" 和 “ 散 点 图 ”. 单 击 选择 的 图 形 按钮 看 到 适当 的 对 话 框 . 例如 , 图 
C. 10 和 C. 11 分 别 显 示 了 垂直 条 形 图 和 散 点 图 的 对 话 框 . 选择 合适 的 变量 , 点 击 “OK” 查 看 图 形 . 
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图 C.9 用 图 表示 数据 的 SPSS 的 分 析 员 选项 
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图 C.10 条 形 图 对 话 框 图 C.11 散 点 图 对 话 框 


C.6 描述 性 统计 量 和 相关 


为 了 利用 SAS 分 析 员 得 到 定量 变量 的 数值 描述 性 度量 ( 如 均值 、 标 准 差 等 )， 点 击 分 析 员 菜单 栏 
上 的 “Statistics” 按 钮 ， 然后 点 击 “ Descriptive” 按钮 ， 最 后 点 击 “ Summary Statistics" ( 见 图 C. 12 ). 图 
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C. 13 给 出 了 所 得 对 话 框 . 


Y SAS - [Analyst: {new project}} 









44 











图 C. 12 得 到 描述 性 统计 量 的 SAS 分 析 员 选 项 


选择 想 要 分 析 的 定量 变量 并 把 它 放 在 “Analysis” 框 中 . (作为 一 个 选项 , 可 以 将 定性 变量 放 人 和 
“Class” 杠 中， 得 到 这 个 定性 变量 的 不 同 水 平 关于 这 个 定量 变量 的 概括 统计 量 . 也 可 以 点 击 对 话 框 上 
B" Statistics" 按钮 并 做 出 选择 ， 控制 用 哪 一 个 特殊 的 描述 统计 量 . ) 点 击 “OK ”按钮 查看 描述 统计 量 的 
输出 . 

为 了 利用 SAS 分 析 员 得 到 定量 变量 对 的 皮尔 逊 乘 积 矩 相关 ， 点 击 分 析 员 菜单 栏 上 的 “Statistics” 
按钮 ,然后 点 击 “ Descriptive" , 最 后 点 击 “ Correlation" (LE C.12). 图 C. 14 给 出 了 随后 得 到 的 对 
话 框 . 
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P I i oK 7 | 
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NEIGH l | | 
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Save Data | Titles | Variables 204 Titles | Var iables | 
€ MÁRMP eaae — Maii aai ad J €— aiii 4 _ 
E & Y > 1 
C.13. ”描述 性 统计 量 对 话 杠 图 C. 14 相关 对 话 框 


将 感 兴趣 的 变量 输入 “Correlate” 框 中 , 然后 点 击 “OK” 得 到 相关 性 的 输出 结果 . 
C.7 假设 检验 


为 了 用 SAS 分 析 员 检验 定量 变量 的 总 体 参 数 ( 比如 均值 、 方差 ) 的 假设 , 点击 分 析 员 菜单 栏 上 的 
"Statistics" 按钮， 然后 点 击 * Hypothesis Tests". 图 C. 15 给 出 了 随后 得 到 的 菜单 . 

点 击 感 兴趣 的 检验 看 到 合适 的 对 话 框 . 例如 , 图 C. 16 和 图 C. 17 分 别 给 出 了 “One-Sample t-test 
for a Mean” 和 “Two-Sample t-test for Means” 的 对 话 框 . 在 适当 的 对 话 框 中 ， 指定 要 检验 的 定量 变量 ， 
原 假设 值 以 及 备 择 假设 的 的 形式 . 对 两 样本 检验 ， 还 需要 指定 表示 这 两 个 样本 (组 ) 的 定性 变量 . 点 
击 “OK” 查 看 检验 结果 . 
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a Mean 
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据 值 , 必须 在 “Two-Way Table” 对 话 框 中 指定 含有 单元 计数 的 变量 . 从 列表 中 选择 变量 , 然后 点 击 
“Cell Counts” 按 钮 即 可 ， 


Frequency Counts: Pondice 
N. x "4 Editor - Untitled1 * 





EIPROC SURVEYFREQ; 
TABLES ICETYPE / CHISQ TESTP-(20 30 501; 





d 
图 C. 19 单 向 表 卡 方 的 SAS 程序 命令 


Table Ana Statistics 


Mica 











图 C.20 ”双向 频数 表 对 话 框 图 C.21 双向 表 统计 量 对 话 框 


C.9 简单 线性 回归 


利用 SAS 分 析 员 进行 简单 线性 回归 分 析 , 在 分 析 员 菜单 栏 上 点 击 “Statisticsy 按钮 , 然后 点 击 
"Regression" , 最 后 点 击 “Simple”， 如 图 C. 22 所 示 . 图 C. 23 给 出 了 随后 得 到 的 对 话 框 . 

在 “Dependent” 框 中 指定 定量 的 因 变量 , 在 “Explanatory” 框 中 指定 定量 的 自 变量 , 在 “Model” 框 
中 务必 选择 “Linear”. 还 可 选择 点 击 “Statisties” 按 钮 生成 模型 参数 的 置信 区 间 , 并 在 随后 得 到 的 菜单 
列表 中 检查 合适 的 菜单 栏 . 也 可 以 分 别 点 击 Predictions" 按钮 和 “Plots” 按 钮 得 到 预测 区 间 和 残 差 图 ， 
并 在 随后 得 到 的 菜单 上 做 出 合适 的 选择 . 点 击 “OK” 查 看 简单 线性 回归 的 结果 . 








SH 


a 


图 C.22 简单 线性 回归 的 SAS 分 析 员 选项 C.23 简单 线性 回归 的 对 话 框 
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C.10 ”多 重 回归 


利用 SAS 分 析 员 对 一 般 线性 模型 进行 多 重 回归 ， 在 分 析 员 菜单 栏 上 点 击 “ Statistics” 按钮 ， 
然后 点 击 “ Regression" , 最 后 点 击 “Linear”， 如 图 C. 24 所 示 . 图 C.25 给 出 了 随后 得 到 的 对 
话 框 . 

在 Dependent” 框 中 指定 因 变量 , 在 “Explanatory” 框 中 指定 模型 中 的 自 变 量 . 还 可 选择 点 击 “Sta- 
tistics” 按钮 得 到 模型 参数 的 置信 区 间 ， 并 在 所 得 的 菜单 列表 中 检查 合适 的 菜单 项 目 . 要 想 生 成 方差 
膨胀 因子 ,点击 “Statistics” 按 钮 ， 再 点 击 “Tests” 按 钮 ,然后 选择 “Variance inflation factors” 选 项 . 可 以 
分 别 点 击 “Predictions” 按 钮 和 “Plots” 按钮， 得 到 预测 区 间 和 残 差 图 ， 并 在 随后 得 到 的 菜单 里 做 出 合 
适 的 选择 . 检查 了 要 求 的 所 有 选项 后 , 点 击 “ OK” 查 看 多 重 回归 结果 ( 注 ， 如 果 模 型 包含 交互 作用 项 
和 /或 二 次 项 , 在 进入 SAS 分 析 员 会 话 之 前 , 必须 在 SAS 程序 的 DATA 命令 行 中 创建 这 些 高 阶 项 变 
Æ, 例如 图 C. 3. ) 


| Statistics Window Help 





3 TFISH 
5 CHANNELCATFISH 
3 CHANNELCATFISH 
3 CHANNELCATFISH 
3, CHANNELCATFISH 





















图 C.24 SAS 分 析 员 的 多 重 回归 选项 图 C.25 多 重 回归 对 话 框 


还 可 以 利用 SAS 分 析 员 中 的 “ANOVA” 选项 拟 合 一 般 线性 模型 . 为 此 点 击 分 析 员 菜单 栏 中 的 
“Statistics” 按钮 ， 然后 点 击 “ANOVA” , 最 后 点 击 “Linear Models” ， 如 图 C. 26 所 示 . 随后 所 得 对 话 框 
见 图 C. 27. 









| ; Dependent, | (T 








—< Flass | hn itatis j 
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HE IGHT 




















图 C. 26 一 般 线性 模型 的 SAS 分 析 员 选项 图 C.27 一 般 线性 模型 对 话 框 
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在 “Dependent” 框 中 指定 因 变 量 , 在 “Quantitutive” 框 中 指定 模型 中 的 定量 自 变 量 , E“ Class” HEP 
指定 定性 自 变量 ( 注 : 对 每 个 指定 的 定性 变量 , SAS 自动 产生 适当 个 数 的 虚拟 变量 ). 选 好 变量 以 后 ， 
Aiii" Model” 按钮， 看 到 图 C. 28 所 示 的 对 话 框 . 

利用 "Cross ”按钮 (对 交互 作用 ) 和 "Polynomial ”按钮 (对 高 阶 项 ) 指定 模型 中 的 项 . 这 些 模 型 项 将 
出 现在 “Effects in Model” HEF, xil; OK" , 返回 “Linear Models" 对话 框 ( 贺 C. 27). 

miii“ Statistics” 按钮， 检查 随后 所 得 菜单 上 的 
" Calculate parameter estimates ”产生 的 模型 参数 估计 Standard Wodols | | md J m 
f&. 还 可 以 分 别 点 击 “predicliuis” 按 钮 和 “plots” 按 peus 











Ht, 882808 DI Re EI, 并 在 随后 所 得 的 菜单 sas 
中 做 适当 选择 . 检查 了 所 有 要 求 的 选项 后 ， 点击 TOO | Sm 
“OK" 看 到 多 重 回归 结果 . || mi 
ipsi creen e: eme 
为 利用 SAS 分 析 员 进行 逐步 回归 分 析 , 点 击 分 
析 员 菜单 栏 中 的 “Statistics” 按钮 , 然后 点 击 “ Regres- 图 C.28 选择 模型 项 的 对 话 杠 


sion”， 再 点 击 “ Linear”, 如 图 C. 24 所 示 . 随后 所 得 的 对 话 框 在 图 C. 25 中 给 出 . 在 “ Dependent” 框 中 指 
定 因 变量 , 在 “Explanatory” 框 中 指定 逐步 模型 的 自 变量 ,现在 点 击 “ Model" 按钮， 随后 所 得 的 菜单 如 
图 C. 29 所 示 . 
对 逐步 回归 模型 ,选择 “Stepwise selection" ( 默认 模型 为 “Full Model" ). 对 所 有 可 能 回归 选择 方 
ik, 选择 "Mallow's Cp” , “R — square” 或 “Adjusted R-square”, 作为 一 种 选项 , 可 以 点 击 “Criteria” 按钮 
Hs a 值 (默认 为 K= 0. 05 ) 选 择 用 于 分 析 中 的 e 值 ,点击 OK" 查看 逐步 回归 结果 ， 


C.11 残 差分 析 和 影响 诊断 


为 了 利用 SAS 分 析 员 进行 残 差分 析 , 点 击 分 析 员 菜单 栏 的 “Statistics” 按钮 ,然后 点 击 “ Regres- 
sion" , 再 点 击 “Linear”, 如 图 C. 24 所 示 . 随后 所 得 对 话 框 显示 在 图 C. 25 中 , 在 “Dependent” 框 中 指定 
因 变 量 , 在 “Explanatory” 框 中 指定 模型 中 的 自 变量 . 为 作 残 差 散 点 图 , 点 击 “plots” 按 钮 , 然后 点 击 
"Residual" S248, ， 随 后 所 得 的 菜单 如 图 C. 30 所 示 . 






verd run oto 











— plots à 
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rand Variable . _ 
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ew f eret. probabi lits DES p plot. y 
| i mcer > - 























图 C.29 ”多重 回归 模型 菜单 选项 图 C. 30 ”多重 回 归 残 差 图 菜单 选项 


在 打开 的 对 话 框 上 点 击 希望 的 残 差 散 点 图 , 在 图 C. 30 所 示 的 菜单 上 点 击 残 差 类 型 ( 纵 轴 ) 和 变 
量 (水 平 轴 ). 还 可 检查 适当 的 框 产生 残 差 的 正 态 概率 图 , 点击“OK" 看 到 残 差 图 . 
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为 进行 影响 诊断 ,点 击 多 元 回归 对 话 框 ( 图 C. 27) B9" Save Data" 按钮 ， 随 后 所 得 的 菜单 如 图 


C. 31 所 示 . 
点 击 紧 挨 着 “Create and Save diagnostic data” 的 框 ， 然后 双击 每 个 选择 ,挑选 希望 进行 的 诊断 . 这 
些 诊断 将 出 现在 “Add" 框 中 , 如 图 C.31 所 示 , AGR OK", J|“ multiple Regression" 对 话 框 ( 图 
C.27), 再 点 击 “OK” 进 行 分 析 . 
为 看 到 影响 诊断 , 双击 出 现在 SAS 分 析 员 主 菜单 屏幕 中 的 “Di 















ato and save diagnostics data —— K Í 
[PREDICTED Predicted + 1 
RESIDUAL Residuals . Varius 1 


|STUDENT Student izi 
Student iz 





poesi] 

















图 C.31 保存 多 重 回归 的 数据 菜单 图 C.32 从 SAS 分 析 员 主 菜单 选择 诊断 表 


C.12 单 向 方差 分 析 


为 了 利用 SAS 分 析 员 对 完全 随机 化 设计 进行 单 向 ANOVA, 点 击 分 析 员 菜单 框 的 “Statistics” 按 钮 ， 然 
后 点 击 “ANOVA”, 最 后 点 击 “One-Way ANOVA” , 如 图 C. 33 所 示 . 随后 所 得 的 对 话 框 如 图 C. 34 FER. 

在 “Dependent” 框 中 指定 因 变量 , 在 “Independent” 框 中 指定 表示 单个 因子 的 定性 变量 . 

为 进行 处 理 均值 的 多 重 比较 , 单 击 “Means ”按钮 得 到 图 C. 34 所 示 的 对 话 框 , 在 这 个 对 话 框 中 选 
择 比 较 方 法 (如 鲍 费 罗 尼 方法 ) 、 比 较 的 错误 率 ( 例 0. 05 显著 性 水 平 ) 并 指定 待 检验 的 主 效 应 . 点 击 
“OK” 返 回 “One-Way ANOVA” 对 话 框 (图 C. 33). 














[C LOCATION | 
MILE 
LENGTH 
HEIGHT 
Save Üptions 
Iridea hua t: J ebore 
SPECIES “` et 
T LI 207 
Penas j 
Tests Means Plots 
Titles 
图 C.33 方差 分 析 的 SAS 分 析 员 选项 图 C.34 单 向 ANOVA 对 话 框 


为 进行 方差 相等 的 检验 , Ait“ One-Way ANOVA” 对 话 框 的 “Test” 按 钮 , 得 到 图 C. 35 所 示 的 菜 
单 . 从 这 个 菜单 选择 执行 的 检验 (如 莱 文 检验 ), 再 点 击 “OK” 回 到 “One-Way ANOVA” 对 话 框 (图 
C.36), 单 击 “OK” 查 看 ANOVA 结果 . 
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Effect Z method: ` 
Cup [SPECIES Z Bonferroni t-t 
| 





图 C. 35 均值 多 重 比较 对 话 杠 图 C. 36 ”检验 方差 相等 性 的 菜单 
C.13 ” 析 因 设计 和 其 他 设计 的 方差 分 析 


为 了 利用 SAS 分 析 员 进行 牵涉 到 两 个 或 多 个 因子 设计 (例如 随机 化 区 组 、 析 因 设计 ) 的 ANOVA, 
点 击 分 析 员 菜 单 栏 的 “Statistics” 按钮 ， 然 后 点 击 ^*ANOVA”， 最 后 点 击 “Fractorial ANOVA” (HE 
C. 33) ， 随 后 所 得 的 对 话 框 如 图 C. 37 Bron. 

在 “Dependent” 框 中 指定 因 变量 , 在 “Independent” 框 中 指定 表示 因子 的 定性 变量 . 为 指定 设计 模 
型 , Aii“ Model” ik, 出 现 如 图 C. 38 所 示 的 对 话 框 , 指定 模型 中 的 项 ， 对 交互 作用 用 “Cross” 按 钮 ， 
模型 项 将 出 现在 “Fffects in model” HEF, 点 击 “OK” 返 回 “Factorial ANOVA” 对 话 框 (图 C. 37). 


Factorial ANDYA: Model 





图 C.37 析 因 ANOVA 对 话 框 图 C.38 析 因 模型 选项 对 话 框 

为 了 对 所 有 处 理 组 合 进行 均值 的 多 重 比 较 ， 点击“Factorial ANOVA” 对 话 框 的 “Means” 按 钮 ， 然 
后 点 击 “LS Means” 按 钮 , 出现 图 C. 39 所 示 的 对 话 框 . 在 “LS Means” 框 中 指定 感 兴趣 的 交互 作用 效 
应 , 并 选择 比较 方法 (如 鲍 费 罗 尼 方法 ), 再 点 击 “OK” 返 回 “Factorial ANOVA” 对 话 框 ( 图 C.37), 点 
击 "OK” 运 行 并 查看 ANOVA 结果 . 






图 C.39 因子 均值 多 重 比较 对 话 框 
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C.14 非 参 数 检验 


利用 SAS 分 析 员 界面 或 SAS 程序 命令 执行 SAS 的 非 参 数 检验 ， 选择 将 随 检验 而 异 . 

符号 检验 

为 运行 符号 检验 ,需要 在 SAS 编辑 器 窗口 指定 适当 的 SAS 程序 命令 . 图 C. 40 显示 的 PROC UNI- 
VARIATE 命令 可 进行 定量 变量 LWRATIO 的 符号 检验 - 
(与 某 些 其 他 单 样本 检验 一 起 ) , 跟 在 “MUO = ”后 面 的 值 
是 总 体 中 位 数 的 原 假设 值 . 

秩 和 检验 与 克 重 塞 - 沃 里 斯 检验 

可 以 利用 SAS 分 析 员 运行 威 尔 科 克 森 秩 和 检验 比较 
两 个 总 体 ， 或 运行 克 鲁 塞 - 沃 里 斯 检验 比较 三 个 或 更 多 总 | 
体 . 点 击 分 析 员 菜单 栏 的 “Statistics” 按 钮 , 再 点 击 “ANO- 了 一 一 一 — 
VA" , 最 后 点 击 “ Nonparameteric One-Way ANOVA”(: 见 图 图 C. 40 符号 检验 的 SAS 程序 命令 
C. 33). 随后 所 得 的 对 话 框 如 图 C. 41 所 示 . 在 “ Dependent" 框 中 指定 待 分 析 的 定量 变量 ， 在 “Independ- 
ent” 框 中 指定 表示 不 同样 本 的 类 型 变量 ， 点 击 “Tests” 按 钮 ， 并 选择 “Wilcoxon ( Kruskul-Wallis tests ) ” 
如 图 C.42 所 示 , AOK”, 再 点 击 “OK" 生 成 SAS 输出 结果 . 





























-Way ~ Nonparametric One-Way ANOVA: fests _ Xj 
[Location tesi scores — — irai 
Dependent | Í Bios (Kruwkal-kattis test) | 
| VOLTAGE i — | Bum der | = 
| f Reset. [Dispersion test scores. _ ——  _ Reset 
— 1 up L i EE 
| === = | d 
| a ij 
| Exact p^vaülue | dd 
[lCelculata exact p-values | 
| Note: Computational time may be 1 
| prohibitive for certain data. | 
l Hu je must be est each time | 
e ee O 
图 C. 41 非 参 数 单 向 ANOVA 对 话 杠 图 C. 42 ”选择 非 参 数 单 向 ANOVA 检验 


符号 秩 检验 

为 了 进行 威 尔 科 克 森 符 号 秩 检验 , 需要 在 SAS 编辑 器 窗口 指出 适当 的 SAS 程序 命令 . 首先 计算 
两 个 成 对 定量 变量 值 之 差 , 然后 运行 如 图 C. 43 所 示 的 PROC VNIVARIATE. 一 定 要 在 VAR 语句 中 指 
定 表示 差 的 变量 . 

LEX LIOS 

为 运行 随机 化 区 组 设计 的 弗 里 德 曼 检验 ， 需要 在 SAS 编辑 器 窗口 指定 适当 的 SAS 程序 命令 . 运 
行 如 图 C. 44 所 示 的 PROC FREQ 得 到 检验 . 在 TABLES 语句 中 指定 区 组 变量 ， 处 理 变量 和 因 变量 , 在 
变量 名 之 间 放 一 个 星 号 , 保证 指定 的 选项 “CMH2 SCORES = RANK NOPRINT” 在 斜 杠 号 后 . PRES 
检验 结果 将 出 现在 SAS 输出 的 “Row Means Scores Differ" 后: 

秩 相关 检验 

为 利用 SAS 分 析 员 执行 斯 皮尔 曼 秩 相关 检验 ， 点击 分 析 员 菜单 的 “Statistics” 按钮 , 然后 点 击 
“Descriptive” , 最 后 点 击 “ Correlation”( 见 图 C. 12). 随后 所 得 的 对 话 框 显示 在 图 C. 14 中 ,在 “Corre- 
late" 框 中 输入 感 兴趣 的 变量 ， 然后 点 击 “ Option”， 在 “ Correlation Types" 下 选择 “Spearman”( 见 图 


770 附录 CC 





C. 45) , 双击 “OK ”得 到 斯 皮尔 曼 检 验 结果 . 
| 


Z% Editor - Untitied1 * 




























S DATA VISCOSITY; 
INPUT MIXTUPE EXP NEW; 
DATALINES; Yy Editor - Untitied1 * 
2.740 2 
2.569 2 CORRODE; 
3 2.411 METAL SEALER CORROSION 68; 
4 2.504 
5 3.237 3 E 1 ài X a 
6 3.044 3.050 2 z 0 23 2 
2.886 2.910 3 3 N 35 3 18 
8 2.957 2.965 4 1 20 3 16 
3.790 — 3.792 š d d 3 3 
10 3.574 3.582 6 1 5 3 6 
11 3.415 3.439 *? x 9 3 12 
12 3.470 3.476 8 1 26 3 21 
9 1 nv $ 8 
10 1 4 3 2 
SDATA VISCOSITY; SET VISCOSITY; ii y 
DIFF=EXP-NEW; 
| =PR9C FREQ; 
| SPROC URIVARIATE ; — Say: oet. 
| “van Dir; > BER 
RUM; 

RUN; x ` 
is] d Le 1 
图 C.43 符号 秩 检验 的 SAS 程序 命令 图 C.44 弗 里 德 受 检验 的 SAS 程序 命令 
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P-values I 
Descriptive statistics i OK j 





xclude missing MANU sanomia 
| @Pairvise i 
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图 C.45 选择 斯 皮尔 曼 相 关 选 项 
C.15 控制 图 与 能 力 分 析 


控制 图 可 以 从 SAS 的 质量 改进 “用 户 友 好 ”菜单 界面 得 到 . 在 创建 并 保存 了 要 分 析 的 SAS 数据 集 
(ML C. 2-5)J8, 点 击 SAS 菜单 栏 的 “Solutions” 按 钮 进入 质量 改进 会 话 , 然后 点 击 “ Analysis”, 再 点 击 
"Quality Improvement" ( 见 图 C. 46). 随后 所 得 的 菜单 显示 在 图 C. 47 中 ， 点 击 “ Control Charts" 按钮 看 
到 如 图 C. 48 Brz BJ “ Control Charts ”菜单 . 点 击 适当 的 菜单 按钮 , 并 在 所 得 的 菜单 屏幕 上 做 出 适当 的 


选择 , 指定 要 分 析 的 数据 集 , 控制 图 类 型 (例如 ,个 体 值 控制 图 、* EJ. R El. p 图 、c 图 ), 过 程 变量 
及 子 组 变量 , Ah“ Rion” 按钮 产生 控制 图 . 


ity Control Menu 
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图 C.46 进入 SAS 质量 改进 会 话 图 C.47 SAS 质量 改进 菜单 
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为 在 SAS 中 进行 能 力 分 析 , 点 击 图 C. 47“ Quality Improvement Menu" E H“ Capability" 按钮， 显示 
图 C. 49 中 的 “Process Capability Analysis" 菜 单 ,点 击 适 当 的 菜单 按钮 并 在 所 得 的 菜单 屏幕 上 进行 适 
当 的 选择 来 指定 要 分 析 的 数据 集 ， 过 程 变量 及 规格 限 , 点 击 ^Run” 按 钮 进行 能 力 分 析 . 





tz Control Charts xj C: Process Capability Analysis TR xj 
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图 C.48 SAS 控制 图 选项 菜单 图 C. 49 SAS 过 程 能 力 分 析 菜 单 


C.16 ”随机 数 发 生 器 


为 了 利用 SAS 分 析 员 生 成 来 自 指定 概率 分 布 观测 值 的 随机 样本 ,点 击 分 析 员 菜 单 栏 上 的 “Data” 
BEL, i" Random Variates”， 将 出 现 如 图 C. 50 所 示 的 概率 分 布 菜单 ,点 击 选 拌 的 概率 分 布 在 
看 得 的 菜单 屏幕 中 输入 样本 大 小 和 要 求 的 分 布 参数 . 正 态 分 布 屏幕 如 图 C. 51 所 示 . A OK” 在 
SAS 分 析 员 扩展 中 显示 随机 样本 的 什 . 
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FdC.50 SAS 分 析 员 随机 变量 菜单 图 C.51 正 态 分 布 菜 单 屏幕 


附录 D MINITAB 视窗 指导 


D.1 MINITAB 的 视窗 环境 


当 进 入 MINITAB 界面 后 , 将 会 看 到 类 似 于 图 D. 1 的 屏幕 . 屏幕 底部 是 一 个 空 的 扩展 表 , 叫做 
MINITAB 工作 表 , 列表 示 变 量 , 行 表示 观测 值 (或 事件 ). 屏幕 的 最 顶端 是 MINITAB 的 主 菜 单 栏 , 包 
括 MINITAB 可 用 的 不 同 功能 和 过 程 按钮 . 一 旦 把 数据 输入 扩展 表 后 , 就 可 以 通过 点 击 适当 的 菜单 按 
钮 来 分 析 数 据 , 结果 将 显示 在 界面 窗口 中 . 
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D.2 创建 准备 分 析 的 MINITAB 数据 工作 表 


可 以 把 数据 直接 输入 工作 表 创 建 MINATAB 数据 文件 . 图 D. 2 显示 的 是 一 组 名 为 BONES 的 长 宽 
之 比 的 数据 , 可 以 将 每 个 变量 的 名 字 链 人 列 号 下 面 的 框 中 来 命名 变量 ( 列 ). 

如 果 数 据 保 存在 外 部 数据 文件 (如 DAT 文 件 ) 中 , 就 可 以 用 MINITAB 的 可 用 选项 来 访问 它 . 点 击 
菜单 栏 的 “File” 按 钮 , 然后 点 击 “0Other Files", 再 点 击 “ Import Special Text”， 如 图 D. 3 所 示 , 将 显示 
如 图 D. 4 的 对 话 框 . 
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图 D.2 输入 到 MINITAB 工作 表 中 的 数据 图 D.3 从 外 部 文件 读 取 数据 的 MINITAB 选项 
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在 “Store data in column(s)” 框 中 输入 CL、C2 、C3 等 名 字 来 指定 数据 集中 的 变量 ( 列 ). 点 击 
"OK", 出 现 图 D. 5 所 示 的 对 话 框 . 


pam 777 i eean Tent From File 
c1 C2 C3 
























E B] Quasar 
2 Sl realestate 
Í E Boilers a Streetven 
Format... | BJ CRUDEOIL walks 
x (3) express 
"m A) afclocks 
€ Replace any existing data in these columna. 
f Append to any existing data in these columns 
， Filename  [AEROEIC ; 
a S x | Fies of ype š 
| Help j o. ， o Í OK L ] Cancel | 


图 D. 4 指定 外 部 数据 文件 中 的 变量 列 图 D.5 选择 外 部 数据 文件 


指定 包含 外 部 数据 文件 的 磁盘 驱动 器 和 文件 夹 ， 点 击 文件 名 ， 然 后 点 击 “Open”, 如 图 D. 5 所 
示 . MINITAB 工作 表 显 示 外 部 数据 文件 中 的 数据 ， 如 图 D. 6 所 示 . 








图 D.6 有 输入 数据 的 MINITAB 工作 表 


St: 可 以 在 列 号 下 面 的 框 中 键 人 每 个 变量 的 名 字 来 命名 变量 ( 列 )， 
D.3 数据 列表 


为 了 得 到 数据 列表 (输出 )， 点 击 MINITAB 主 菜单 栏 上 的 “ 
ta”( 见 图 D. 7), 随后 出 现 的 菜单 或 对 话 框 如 图 D. 8 所 


play" 框 内 输入 想 要 输出 的 变量 名 (也 可 以 简单 点 击 这 些 变量 ) ， 然后 点 击 "OK”, 屏幕 上 将 会 显示 
输出 结果 . 


Manip ”按钮 ,然后 点 击 “ Display Da- 


示 . 在 “Columns constants and matrices to dis- 
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3 CHANNELCATFIS 















3 CHANNELCATFISH 48.0 
图 D.7 得 到 数据 列表 的 MINITAB 菜单 选项 图 D.8 显示 数据 对 话 框 


D.4 图 示 数 据 


为 了 得 到 数据 的 图 形 描述 (例如 条 形 图 、 直 方 图 、 散 点 图 等 等 ), 点 击 MINITAB 菜单 栏 中 的 
“Graph” 按钮, 随后 出 现 的 菜单 列表 如 图 D. 9 所 示 , 包含 在 这 个 文本 中 的 几 个 选项 是 “(bar) Chart” 
(条 形 图 ) 、“ (scatter) Plot” (RARI). “ Histogram” ( 直方 图 ) 、”( normal) Probability plot”( 正 态 概 率 
图 ) 和 “Stem-and-Leaf”( 茎 叶 图 ). 点 击 选择 的 图 查看 合适 的 对 话 框 . 例如 , 直方 图 和 散 点 图 对 话 框 分 
别 如 图 D. 10 和 D. 11 所 示 , 进行 适当 变量 选择 并 点 击 “OK” 查 看 图 形 . 





M 
LENGTH 
WEIGHT 
DDT 









| Display [v For each [v] Group variables É 
Bar ^. | Graph 


Edit Attributes... J 


Annotation 日 Frame Fl E Beals 
Il Lao | 


图 D.9 用 图 表示 数据 的 MINITAB 图 D.10 直方 图 对 话 框 
菜单 选项 
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Edit Attributes... 


Frame |v | Regions [v] 








图 D.11 散 点 图 对 话 框 


D.5 描述 性 统计 量 及 相关 


为 了 得 到 定量 变量 的 数值 描述 性 度量 ( 如 均值 、 标 准 差 等 ) ,点击 MINITAB 主 菜单 栏 中 的 “Stat” 
按钮 ,然后 点 击 “Basic Statistics” > 再 点 击 “ Display Descriptive Statistics" ( 见 图 D. 12) ,随后 所 得 的 对 
话 框 如 图 D. 13 所 示 . 


BY MINITAB ` Untitled 






Display Descriptive Statistics 


Variables: RC 








f Byvanable: “>| Eis 





* w * v w v w w v w 





EDA 
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opnaa- pazin maini n 









5 CHANNELCATFIS ' : h -一 一 Graphs. _ 
5 CHANNELCATFISH 50.00 Hep | o M MN 
5 CHANNELCATFISH 520 1255 15000 ; | LN Re E s 





图 D. 12 得 到 描述 性 统计 量 的 MINITAB 选项 图 D. 13 ”描述 性 统计 量 对 话 杠 


选择 要 分 析 的 定量 变量 ， 并 将 它们 放 人 “Variables” 框 
中 .( 作 为 一 个 选项 ， 可 以 点 击 “Graph” 按 钮 并 做 适当 的 选择 
创建 数据 的 直方 图 和 点 图 . ) 点 击 "OK” 查 看 描述 性 统计 量 的 
输出 . 

为 了 得 到 定量 变量 对 的 皮尔 示 乘 积 矩 相关 ， 点 击 主 菜单 
栏 的 “Stat” 按 钮 ,然后 点 击 “ Basic Statistics”， 再 点 击 “ Corre- 
lation”( 见 图 D. 12) , 随后 所 得 的 对 话 框 如 图 D. 14 所 示 . 在 
“Variables” 框 中 输入 感 兴趣 的 变量 ， 然后 点 击 “OK” 得 到 相 
关系 数 输 出 . 






[LENGTH WEIGET DDT 


D 





T Display pvalues 
-] C Stere matrix isplay notion 


图 D.14 相关 性 对 话 杠 
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|D.6 假设 检验 


为 了 对 总 体 参 数 (如 均值 、 方 差 、 比 率 ) 假设 进 行 检 验 , 在 MINITAB 菜单 栏 中 反击 Stat” 按钮 ， 
然后 点 击 “ Basic Statistics” , 随后 出 现 的 菜单 如 图 D. 15 所 示 . 











C 
C EDA — x 
č | Power and Sample Size > 
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C 5 CHANNELCATFIS Pee "s 
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图 D.15 假设 检验 的 MINITAB 选项 


点 击 感 兴趣 的 检验 查看 适当 的 对 话 框 , 做 适当 的 菜单 选择 , 然后 点 击 “OK” 查 看 结果 . 例如 ,对 
总 体 均 值 的 “1-Sample t” 检 验 对 话 框 如 图 D. 16 和 D. 17 所 示 , 在 图 D. 16 rp , 在 “Variables” 框 中 指定 
要 检验 的 定量 变量 , 在 “Test mean” 框 中 指定 原 假设 的 值 . 为 了 指定 均值 置信 区 间 的 置信 水 平 、 选 择 
备 择 假 设 形式 ， 点击“ Options", 做 出 如 图 D. 17 的 选择 . 点 击 “OK” 回 到 “1-Sample t” 对 话 框 (图 
D. TE Ae 点 击 “OK” 查 看 检验 结果 . 


1-Sample t - Options 





D.7 分 类 数据 分 析 


MINITAB 可 以 对 双向 ( 列 联 ) 表 进行 卡 方 检验 , 但 是 通常 不 能 进行 单 向 表 卡 方 检 验 . 

为 了 对 双向 表 进行 卡 方 检验 , 首先 访问 包含 样本 数据 的 MINITAB 工作 表 文 件 ， 数据 文件 应 该 包 
含 两 个 定性 变量 , 以 及 对 数据 集中 个 观测 值 的 每 个 类 型 值 . 另外 , 工作 表 可 以 包含 两 个 定性 变量 每 
种 类 型 的 单元 计数 . 在 MINITAB 主 菜单 栏 中 点 击 “Stat” 按钮 ， 然 后 点 击 “Tables” 和 “Cross Tabulation 
and Chi-Square”， 如 图 D. 18 所 示 . 
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随后 所 得 的 对 话 框 如 图 D. 19 所 示 . 在 “For rows” 框 中 指定 一 个 定性 变量 , TE" For columns" f£ rh 
指定 另 一 个 定性 变量 . (注意: 如 果 工 作 表 中 包含 类 型 的 单元 计数 ， 则 在 “Frequencies are in” 框 中 输 
入 带 单元 SUERESN. ) 然 后 ， did a asuaka (例如 , 计数 、 百 分 数 ). 然后 点 


Cross Tabulation and Chi-Square 8 xj 


C2 WORK Categorical variables: ] 
For rows: SATISF 
For columes: [USER 
Í | 


For layers: 




















Frequencies are in:  DEEGNELOEMA oenn 
Rejabüty Survival 
Mativariate 5- 
os ker | Iv Counts 
T Row percents 
T Column percents 
T Total percents Cht-Square... | Other Stats... | 1 
Seler j mes. d 
n Eo | Cancel | 
Ei D. 18 MH Ants MINITAB 菜单 选项 SID.I9 MINITAB 330/48: i 


it; " Chi-square” "按钮 ,随后 所 得 的 对 话 框 如 图 D. 20 所 示 . Cross Tabulation - Chi-Squ: 
idi Chi-Square analysis" f^ Expected cell counts" , 并 点 击 Display 

OK” , 当 回 到 “Cross BONITA ts ,点击 “OK” 生 po 
成 MINITAB 输出 . Pm awa 

[ 注 : 如 果 MINITAB 工作 表 仅 在 列 中 包含 列 联 表 的 单 eae asume amc 

元 计数 ,点击 “ Chi-Square Test (Table in Worksheet ) " 菜单 i | 
选项 ( 见 图 D. 18) , 在 “Columns containing the table” 框 中 指 Hep | Cancel A | 
定 列 , 点 击 “OK” 生 成 MINITAB 输出 . ] Ë 


D.8 简单 线性 回归 和 多 重 回 归 


为 了 进行 一 般 线 性 模型 的 回归 分 析 , 在 MINITAB 菜单 栏 中 点 击 “ Stat" 按钮 ,然后 点 击 “Regres- 
sion”， 再 点 击 “ Regressin” , 如 图 D. 21 所 示 ， 随 后 出 现 的 对 话 框 如 图 D. 22 所 示 . 





图 D.20 MINITAB 的 卡 方 对 话 框 
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图 D.21 回归 的 MINITAB 选项 图 D.22 回归 对 话 框 


在 “Response” 框 中 指定 定量 因 变 量 , 在 “Predictors” 框 中 指定 自 变量 . (E; 如 果 模 型 包含 交互 作 
用 和 /或 平方 项 ,必须 在 进行 回归 分 析 之 前 创建 并 添加 这 些 高 阶 变量 到 MINITAB 工作 表 中 ,可 以 点 
击 MINITAB 主 菜 单 栏 中 的 “ Calc” 按 钮 ， 选择 “ Calculator” 选 项 做 到 这 一 点 . ) 

还 可 以 利用 MINITAB 点 击 “Options” 按 钮 ， 并 在 随后 所 得 菜单 列表 的 合适 菜单 项 中 打 钩 生成 因 
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变量 未 来 值 的 预测 区 间 和 方差 膨胀 因子 . 可 以 点 击 “ Graph” 按 钮 , 在 随后 所 得 菜单 中 做 合适 的 选择 得 
到 残 差 图 . jui" OK", 从 任 一 个 这 些 选 择 的 屏幕 回 到 主 回 归 对 话 框 , 点 击 回归 对 话 框 中 的 “OK” 查 
看 线性 回归 结果 . 

另外 , 还 可 以 点 击 MINITAB 主 菜单 栏 中 的 “Stat” 按 钮 , 然后 点 击 “ANOVA” 按 钮 , 再 点 击 “Cener- 
al Linear Model” 拟 合 一 般 线性 模型 , 如 图 D. 23 Brzs, 随后 出 现 的 对 话 框 如 图 D. 24 所 示 . 


Emma 
Die Gd Meno Lac Sta froph Egto Window Hep ur cl j Responses: [EDT 

Banie Setitis , " 
Boyer , Ë 















Ünewy, 

























; z 

— 12 DUK * Onewag (Urmacked) 

_ š Conte Charts * T 1 E: 
I Quy Tools. > 
| RejabwSuvwg — Random factors: — 
| Penis , i E 
I Time Sener , = 
| quis * ^ Balanced MANOVA, 
il Í F Mere ; Generd MAMOVA.. .Covastes.. | — Optons.. | Comparisons: 
| f E ] 
| Power and Sample See > Test fos E qual Varisncen. Graphs... | fidit. Siap. 
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图 D.23 ” 拟 合 一 般 线性 模型 的 MINITAB 选项 D. 24 ”一般 线性 模型 对 话 框 


在 “Responses” 框 中 指定 因 变 量 , 在 “Model” 框 中 指定 模型 项 . ( 注意 ， 对 每 个 指定 的 定性 变量 ， 
MINITAB 自动 产生 适当 个 数 的 虚拟 变量 . 而 且 ， 在 有 交互 作用 的 变量 之 间 放 置 星 号 表示 交互 作用 项 
如 LENGTH * WEIGHT. 类 似 的 记号 也 可 以 用 于 平方 项 , 例如 LENGTH * LENGTH. ) dili ^ Covariates” 
按钮 , 把 这 些 变量 放 入 “Covariates” 框 中 , 指出 模型 中 定量 自 变量 . 

为 得 到 模型 中 所 有 项 的 参数 估计 ， 点 击 “ Results” 按 钮 做 出 合适 的 选择 . 为 保存 预测 值 和 残 
差 , Mik“ Storage” 按钮 并 做 出 合适 的 选择 . 为 生成 残 差 图 ， 点 击 “ Graph" 按钮 并 做 出 合适 的 选 
PE. 当 需 要 的 所 有 选项 已 经 打 钩 时 ,在 “General Linear Models" 对 话 框 中 点 击 “OK” 查 看 多 重 回 
HAR. 


D.9 逐步 回归 






 "Hesponse: [pot dh 








Predictors: 
NILE LENGTH SEIGHT 


为 进行 逐步 回归 分 析 , CERAN ba Sa”, 然 上 — 
Iri cili" Regression" , 再 点 击 Stepwise” ( 见 图 D. 21) , p | 3 | 
后 出 现 如 图 D. 25 所 示 的 对 话 框 . 在 “ Response ” dE 中 指 定 | — meyi | 
因 变 量 ,在 “Predictors" 框 中 指定 逐步 模型 的 自 变量 . 作 | = | 


为 选项 , 还 可 以 点 击 “Methods” 按 钮 指定 一 个 值 选择 分 析 d 
中 所 用 的 o 值 ，( 缺 省 值 是 a —0.15. ) Ah OK ERZ Help 
步 回归 结果 . 

为 了 进行 所 有 可 能 回归 的 选择 分 析 , 点 击 主 菜单 栏 En2s EARE 
上 “Stat” 按 钮 ,然后 点 击 “ Regression”， 再 点 击 “Best Subsets” ( 见 图 D. 21 ). 在 随后 所 得 的 菜单 上 的 
“Response” 框 中 指定 因 变量 , 在 “Predictors” 框 中 指定 自 变 量 . 点 击 “ OK" 查看 所 有 可 能 回归 的 选择 
结果 . 
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D.10 ” 残 差 分 析 和 影响 诊断 


为 了 进行 残 差 分 析 , 点 击 MINITAB 主 菜单 栏 中 “Stat” 按 钮 ， 然后 点 击 “Regression”, 再 点 击 “ Re- 
gression” ( ILE] D. 21) , 随后 出 现 的 对 话 框 如 图 D. 22 所 示 . 在 “Response” 框 中 指定 因 变 量 , 在 “Pre- 
dictors” 框 中 指定 模型 中 的 自 变量 . 为 了 生成 残 差 图 ， 反击 “Graph” 按 钮 , 随后 的 菜单 如 图 D. 26 FER. 

为 了 生成 直方 图 , 选择 “ Histogram of residuals” ;为 了 生成 正 态 概率 图 , 选择 “Normal plot of residu- 
als" ;为 了 生成 残 差 对 预测 值 的 残 差 图 ,选择 “ Residuals versus fits” ; 为 了 生成 残 差 对 一 个 或 多 个 自 变 
量 的 残 差 图 , 在 “Residuals versus the variables” 框 中 输入 要 作 图 的 自 变 量 ， 点 击 “OK” 查 看 图 形 . 

为 了 进行 影响 诊断 , 点 击 回归 对 话 框 (图 D. 22) 中 "Storage" 按钮， 随后 得 到 的 菜单 如 图 D. 27 所 示 . 
E 


Fegression | Graphs 
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£ Reguler f Btandardized C Deleted 
le^ sr — Aesidual Plots. 

V Histogram pf residuala 

F Normal pio) ol residosis 












F Residual versus fits | Diagnostic Measures Characteristics of Estimated Equation 
F Residusls versus order F Residuals T oCoelücients 
| Residuals versus the variables: F Standardized residuals D fus 
| LENGTH F Deleted t residuais T MSE 
| F Hi lleverages] F NX inverse 
I H F Cooks distance F R matrix 
r pris 
= o n et E 
Help | i. a] Cancel J | Help | | OK ] Cancel J 
图 D. 26 ”多 重 回归 的 残 差 图 菜单 选择 图 D.27 回归 的 存储 菜单 选择 


点 击 想 要 保存 的 影响 诊断 [ 如 “Cook’s distance" fil" Hi ( leverages)” ] , 点击 “OK” 回 到 回归 对 话 框 . 
现在 点 击 %OK”, 在 MINITAB 工作 表 的 附加 列 出 现 影响 诊断 . 


D.11 单 向 方差 分 析 


为 了 对 完全 随机 化 设计 进行 单 向 方差 分 析 , 点 击 MINITAB 主 菜 单 栏 中 “ Stat” 按钮， 然后 点 击 
“ANOVA” , 最 后 点 击 “One-Way”, 如 图 D. 28 所 示 ， 随后 出 现 的 对 话 框 如 图 D. 29 所 示 . 


One-way Analysis of Variance 





CE Moe de Su G We de 
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LECT NEU us 
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r Store residuals 
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, 
, 
* 
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d- 
* 
+ 
Si 


T T | P TENE x Graphs. | 
Help | [ow J Cancel 


图 D.29 单 向 ANOVA 的 对 话 框 











在 “Response” 框 中 指定 因 变 量 ， 在 “Factor" 框 中 指定 表示 单个 因子 的 定性 变量 . 为 了 进行 处 理 均 
值 的 多 重 比较 , 点击“ Comparisons" 按钮 得 到 图 D. 30 中 的 对 话 框 . 在 这 个 框 中 , 选择 比较 方法 (如 
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Tukey) 和 比较 的 错误 百分率 (如 指定 “5 ”为 5% 的 显著 水 平 ). 点 击 “OK” 回 到 “One-Way ANOVA” 对 话 
框 (图 D. 29) , 点 击 “OK” 查 看 方差 分 析 结 果 . 

为 了 进行 方差 相等 性 检验 , 点 击 MINITAB 主 菜单 栏 中 “Stat” 按 钮 , 然后 点 击 “ANOVA”, 最 后 点 
击 “Test for Equal Variances”, 如 图 D. 31 所 示 . 出 现 图 D. 32 的 对 话 框 , 在 “Response” 框 中 指定 因 变 
Ht, 在 “Factor” 框 中 指定 表示 单个 因子 的 定性 变量 , 指定 “Confidence level" , 然后 点 击 “OK” 查看 检验 
结果 . 


















图 D. 30 均值 的 多 重 比较 对 话 框 图 D.31 检验 方差 相等 性 的 MINITAB 选项 


Test for Equal Variances 





"rom 检验 方差 相等 性 的 对 话 框 
D.12 ” 析 因 设计 和 其 他 设计 的 方差 分 析 


为 了 对 包含 两 个 或 多 个 因子 的 设计 (如 随机 化 区 组 设计 和 析 因 设计 ) 进行 方差 分 析 , 点 击 MINIT- 
AB 主 菜单 栏 中 “Stat” 按 钮 , 然后 点 击 “ANOVA”, 最 后 点 击 “Two - Way”( 见 图 D. 33) , 随后 出 现 的 对 
话 框 如 图 D. 34 所 示 . 

在 “Response” 框 中 指定 因 变 量 , ZE“ Row Factor” 框 中 指定 第 一 个 定性 因子 , ZE“ Column Factor” HE 
中 指定 第 二 个 定性 因子 . 对 仅 有 主 效应 ( 如 随机 化 区 组 设计 ) 的 设计 在 “Fit additive model” HE F-11455; 
否则 , 将 会 自动 拟 合 带 主 效应 和 因子 交互 作用 的 模型 ， OK" 查看 方差 分 析 结 果 . 

对 于 更 一 般 的 析 因 设计 , 点 击 MINITAB 主 菜单 栏 中 “Stat” 按 钮 , 然后 点 击 “ANOVA” , 最 后 点 击 
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“General Linear Model" ( 见 图 D. 33) ， 随 后 出 现 的 对 话 框 如 图 D. 35 所 示 . 


22 


18 








2 


D.33 双向 ANOVA 的 MINITAB 选项 -图 D.34 双向 ( 析 因 )ANOVA 对 话 框 


TE“ Responses" 框 中 指定 因 变 量 , 在 “Models” 框 中 指定 因子 模型 的 项 . ( 注意; 在 有 交互 作用 的 变 
量 之 间 放 一 个 星 号 表示 交互 作用 项 , 如 RATIO « SUPPLY. ) 

为 了 对 处 理 主 效应 进行 均值 的 多 重 比较 ,点 击 “Comparisons” 按钮 . 出 现 的 对 话 框 如 图 D. 36 所 
7. 在 “Terms" 框 中 指定 要 检验 的 主 效应 , 并 且 选 择 比较 “method”( 如 Bonferroni) , 然后 点 击 “OK” 回 
P|“ Factorial ANOVA” 对 话 框 (图 D. 35). 点 击 “OK” 运 行 并 查看 ANOVA 结果 . 





General Linear Model - Comparisons 








RÀ 


SU 
PROFIT 


Contraldevele, | 













Method 、 
Tony 
E Danc ^ ` 
F Bonferroni 

T Sidak | 





图 D.35 析 因 ANOVA 一 般 线性 模型 的 对 话 框 图 D. 36 因子 均值 的 多 重 比较 对 话 框 


D.13 ” 非 参 数 检验 


符号 检验 

包含 样本 数据 的 MINITAB 工作 表 文件 应 该 包含 单个 定量 变量 . 点 击 MINITAB 菜单 栏 上 的 “Stat” 
按钮 , 然后 点 击 “ Nonpatametrics” 和 “1-Sample Sign”, 如 图 D. 37 rz. 

得 到 的 对 话 框 如 图 D. 38 所 示 . 在 “ Variables” 框 里 输入 要 分 析 的 定量 变量 ， 选择 “Test median” 选 
项 并 且 指定 中 位 数 的 假设 值 和 备 择 假设 的 形式 (“not equal” , "less than”, "greater than"). z^ OK" 
得 到 MIBITAB 输出 结果 . 
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图 D.37 MINITAB 非 参数 菜单 选项 


秩 和 检验 


包含 样本 数据 的 MINITAB 工作 表 文 件 应 该 包 






1-Sample Sign 





od E AE E SE 
Cl READING 





图 D. 38 MINITAB 单 样 本 符号 的 对 话 框 


含 两 个 定量 变量 ， 对 应 于 进行 比较 的 两 个 样本 . 点 


击 MINITAB 菜单 栏 上 的 “Stat" 按 钮 ， 然后 点 击 “Nonpatametrics” 和 “ Mann-Whitney" ( 见 图 D. 37) , 得 到 
的 对 话 框 如 图 D. 39 所 示 . fE“ First Sample” 框 里 指定 第 一 个 样本 的 变量 , TE“ Second Sample” 框 里 指定 
第 二 个 样本 的 变量 . 指定 备 择 假设 的 形式 (“not equal" , “less than" , "greater than”), 点击“OK” 得 到 


MINITAB 输出 结果 . 
符号 秩 检验 


包含 配对 数据 的 MINITAB 工作 表 文 件 应 该 包含 两 个 定量 变量 , 对 应 于 进行 比较 的 两 组 . 需要 计 
算 两 个 变量 之 间 的 差 , 并 将 结果 保存 在 工作 表 的 某 列 中 . (用 MINITAB KAH“ Cae” 按钮 . ) 然后 
点 击 MINITAB 菜单 栏 上 的 “Stat” 按 钮 ， 再 点 击 “ Nonpatametrics” 和 “1 -Sample Wilcoxon” ( 见 图 D. 37), 


得 到 的 对 话 框 如 图 D. 40 所 示 . 


Mann-Whitney 






; I Í 


Second Sample: | CROUP-2" m | 








Confidence level: eo | 
| 

D 

| 

| 

| 

| 


Alternative: [not equal zj | 


， Select | — | : | 
* Mem | cme || 


图 D.39 MINITAB & - 惠 特 尼 对 话 框 


1-Sample Wilcoxon 





在 “Variables" 杠 中 输入 表示 配对 差 的 变量 . 选择 *Test median" 选项 ,并 指定 中 位 数 的 假设 值 “0”. 
选择 备 择 假设 的 形式 (“not equal”, “less than”, “greater than”), Ai; OK" 8.8] MINITAB 输 出 结果 . 
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克 鲁 塞 - 沃 里 斯 检验 

包含 完全 随机 化 设计 数据 的 MINITAB 工作 表 文 件 应 该 含有 一 个 定量 变量 ( 响应 或 者 因 变量 ) 和 
一 个 至 少 两 水 平 的 因子 变量 . 点 击 MINITAB 菜单 栏 上 的 Kruskal-Wallis i i xj 
"Stat" 按钮 ， 然 后 选择 “N onpatametrics” 和 “ Kruskal-Wallis” l ias 
CILE] D. 37). 得 到 的 对 话 框 如 图 D. 41 所 示 . TE“ Response" | 
框 中 指定 响应 变量 , 在 “Factor” 框 中 指定 因子 变量 点 击 
“OK” 得 到 MINITAB 输出 结果 . 

弗 里 德 曼 检验 

包含 随机 化 区 组 设计 数据 的 MINITAB 扩展 表 文 件 应 
该 有 一 个 定量 变量 (响应 或 者 因 变 量 ) ,个 因子 变量 以 及 — 












Factor: JBRAND 





Ca 


一 个 分 区 变量 . 点 击 MINITAB 菜单 栏 上 的 “Stat” 按 钮 , 然 ” 一 村 | L e T] ee f] 


后 选择 “ Nonpatametrics” 和 “Friedman” CILE] D.37), 得 到 图 D.41 MINITAB X: &3E - 沃 里 斯 对 话 框 
的 对 话 框 如 图 D. 42 所 示 . 在 适当 的 框 中 指定 响应 、 处 理 和 


分 区 变量 , 然后 点 击 “OK” 得 到 MINITAB 输出 结果 . 

秩 相 关 

为 了 在 MINITAB 中 得 到 斯 皮尔 曼 秩 相关 系数 ， 首先 必须 对 两 个 感 兴趣 的 定量 变量 值 进 行 排 秩 . 
点 击 MINITAB 菜单 栏 上 的 “Cale” 按 钮 ， 创建 添加 的 两 列 ,一列 是 x 变量 的 秩 , 一 列 是 y 变量 的 秩 . 
(利用 MINITAB 计算 器 的 “Rank” 函数 . ) 然 后 点 击 主 菜单 栏 上 的 “Stat" 按 钮 , 点击“Basic Statistics" fl 
“Correlation”. 得 到 的 对 话 框 如 图 D. 43 所 示 . 在 “ Variables” 框 中 输入 排 秩 的 变量 ， 不 选择 “Display p- 
values”. 点 击 “OK” 得 到 MINITAB 输出 结果 . (为 了 进行 检验 , 需要 查 斯 皮尔 曼 秩 相关 的 临界 值 . ) 


Response: [DISTANCE Correlation & 
Te ISRAND — Variables: 
(eMe. BRAN "RANK-FAT' 'RANK-PIS' 
Blocks: GOLFER 
Í Store residuals 
T" Store fits 

: zl 









= Display p'values 





Select | Select | = Store matrix [display nothing) 
Hep | caneel | Hep | caneel | 
= YY e 
图 D.42 MINITAB $ H & & xHi-E 图 D.43 MINITAB 相关 性 对 话 框 


D.14 控制 图 和 能 力 分 析 


为 了 创建 过 程 数据 的 控制 图 ， 首先 访问 包含 质量 数据 的 MINITAB 工作 表 文 件 . 然后 点 击 MINIT- 
AB 工具 栏 上 的 “Stat” 按 钮 , 再 点 击 “Control Charts”. 得 到 的 菜单 (如 图 D. 44 所 示 ) 允许 选择 “Varia- 
bles Charts for Subgroups” ( fs Al x KIJI R KI), “Variables Charts for Individuals" (例如 x 图) , 和“ Attrib- 
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utes Charts" (例如 p 图 和 < 图 ). 在 做 出 选择 之 后 , 另 一 个 菜单 允许 选择 选 好 的 图 . 

得 到 * 图 对 话 框 如 图 D. 45 所 示 . 如 果 工 作 表 的 每 一 行 表示 一 个 个 体 的 质量 测量 值 , 那么 指定 
“Data are arranged as; Single column" , 如 图 D. 45 所 示 . 在 下 面 的 框 中 输入 质量 变量 , 给 出 子 组 容量 . 
如 果 工 作 表 的 每 一 行 表示 一 个 子 组 ,包含 表示 样本 测量 值 的 列 , 那么 指定 “Data are arranged as; Sub- 
groups across rows of” , 如 图 D. 46 所 示 , 在 下 面 的 框 中 输入 包含 样本 测量 值 的 列 . 
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图 D.44 MINITAB 控制 图 菜单 选项 图 D.45 MINITAB Xbar 控制 图 对 话 框 
( 行 是 个 体 的 单位 ) 


如 果 想 让 MINITAB 对 图 上 绘 的 点 运用 模式 分 析 原 则 ， 点击“Xbar( 或 R) Options ”按钮 ， 点击 
“Tests”, 在 想 应 用 的 原则 处 打 钩 . 点 击 “OK” 回 到 控制 图 对 话 框 , 再 次 点 击 “ OK” 得 到 MINITAB 控 
制图 . 

为 了 创建 属性 数据 的 p 图 或 者 。 图 , 点 击 MINITAB 工具 栏 上 的 “Stat”， 然后 点 击 “ Control Charts” 
FII" Attributes Charts”( 见 图 D. 44). 在 得 到 的 菜单 上 选择 “P” 或 者 “C”， 随后 得 到 的 对 话 框 类 似 于 图 
D. 47 所 示 . 指定 表示 不 合格 品 个 数 的 变量 和 子 组 (样本 ) 容量 . 如 果 想 让 MINITAB 对 图 上 绘 的 点 运用 
模式 分 析 原 则 , 点 击 “P( 或 C) Chart Options" S£, jfi di^ Tests" , 在 想 运用 的 原则 处 打 钧 . 点 击 ^OK” 
回 到 控制 图 对 话 框 , 再 点 击 “OK” 得 到 MINITAB 控制 图 . 


P Chart - Data Source 
pu UIT RE 
[CI SAMPLE Va 








Xbar Chart - Data 








图 D. 46 MINITAB Xbar 图 对 话 框 ( 行 是 子 组 ) 图 D.47 MINITAB p 图 对 话 杠 

为 了 创建 一 个 能 力 分 析 图 , 点 击 MINITAB 工具 栏 上 的 “ Stat” 按钮 ,然后 点 击 “ Quality Tools ”， 
“Capability Analysis” 和 “Normal”, 如 图 D. 48 所 示 . 得 到 的 对 话 框 类 似 于 图 D. 49 所 示 ， 在 菜单 屏幕 上 
指定 感 兴趣 的 质量 变量 、 子 组 容量 和 规格 下 限 、 规 格 上 限 . 点 击 “ Options” 按 钮 指定 图 上 显示 的 统计 
量 的 类 型 (例如 C, 和 超出 规格 限 的 百分数 ). 点 击 “OK” 得 到 MINITAB 能 力 分 析 图 . 
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D MINITAB - Untitted [Beta 2} Data are arranged as , Beste. | 
: * Single column: ['PÀ-Fà 
(0 Estimate.. J 
Subgroup size: [5 i 
fuse a constant or ah [D column] - m] 


C Subgroups across rows ek: zw | 





图 D.48 MINITAB 能 力 分 析 菜单 选项 D.49 MINITAB 能 力 分 析 对 话 框 
D.15 ”随机 抽样 和 随机 数 发 生 器 
随机 抽样 


为 了 从 存储 在 MINITAB 工作 表 中 的 数据 集 得 到 观测 值 (事件 ) 的 随机 样本 , 点 击 MINITAB 菜单 
栏 上 的 “Cale” 按 钮 , 然后 点 击 “Random Data” ， 最 后 点 击 “ Sample from Columns" , 如 图 D. 50 所 示 . 得 
到 的 对 话 框 如 图 D. 51 所 示 . 指定 样本 容量 (即行 数 )， 抽样 的 变量 和 想 存 放样 本 的 列 , 点 击 “OK”， 
MINITAB 工作 表 将 在 指定 列 中 出 现 选择 (抽样 ) 的 变量 的 值 . 








Store samples jn: 
cin 













zi 
| ua | F Sample with replacement 
图 D. 50 对 数据 进行 抽样 的 MINITAB 菜单 选项 图 D. 51 从 工作 表 的 列 中 选取 随机 样本 


的 MINITAB 选项 


在 MINITAB 里 , 也 可 以 生成 事件 个 数 的 样本 . 从 MINITAB 菜单 栏 ， Fb" Cale" , 再 点 击 “Ran- 
dom Data” , 最 后 点 击 “Uniform” 选 项 (参看 图 D. 50) ,得 到 的 对 话 框 如 图 D. 52. 指定 产生 的 事件 ( 行 ) 
个 数 , 即 样本 容量 , 指定 存放 选择 的 事件 个 数 的 列 . Pid; OK", MINITAB 工作 表 将 在 指定 列 中 重 现 
选 定 的 (抽样 的 ) 事 件 个 数 . 

[ 注 : 如 果 想 从 数据 集中 多 次 生成 同样 (完全 相同 ) 的 样本 ， 那么 首先 点 击 图 D. 50 中 的 “Set 
Base" 选项 , 在 得 到 的 对 话 框 里 指定 一 个 整数 . 如 果 总 是 选择 同样 的 整数 , 在 选择 随机 抽样 选项 的 时 
候 ，MINITAB 将 会 选择 同样 的 样本 . ] 
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随机 数 发 生 器 


为 了 从 指定 的 概率 分 布 产 生 一 个 观测 值 的 随机 样本 , 点 击 MINITAB 工具 栏 上 的 “Cale” 按 钮 , 然 
Ji siii Random Data” , 最 后 点 击 选择 的 概率 分 布 (例如 “Normal” ). MINITAB 能 提供 的 所 有 概率 分 布 
的 列表 见 图 D. 50. 随后 得 到 的 生成 “ 正 态 ”数据 的 对 话 框 如 图 D. 53 所 示 . 
IE 


Normal Distribution 


Generate [75 rows ol data 


Store in columnis]: 
eid 








iswerendpont [1 77 Mew 
Upper endpoint: FM Standard deviation: s 
Help | i | Cancel | eu La Ñx Cancel | | 
图 D. 52 选择 事件 的 随机 样本 的 MINITAB 选项 图 D. 53 ”选择 事件 的 随机 样本 的 MINITAB 选项 


由 指定 生成 数据 的 行 数 输入 样本 容量 ， 然后 输入 分 布 的 参数 值 (例如 均值 和 标准 差 ). 点 击 
"OK", MINITAB 工作 表 的 指定 列 中 将 给 出 随机 样本 的 值 . 


附录 E SPSS 视窗 指导 


E. 1 SPSS 视窗 环境 


进入 SPSS 界面 , 将 看 到 类 似 于 图 E. 1 的 屏幕 . 屏幕 的 主要 部 分 是 一 张 空白 的 扩展 表 , 列表 示 变 
E, 行 表示 观测 值 (或 者 事件 ). 屏幕 的 最 顶端 是 SPSS 主 菜单 栏 , 包括 了 SPSS 提供 的 不 同 函 数 和 程 
序 的 按钮. 一 旦 将 数据 输入 扩展 表 ， 点 击 适当 的 菜单 按钮 就 可 以 分 析 这 些 数据 . 


E.2 创建 一 个 准备 分 析 的 SPSS 扩展 表 数 据 文件 


可 以 将 数据 直接 输入 扩展 表 , 创建 一 个 SPSS 数据 文件 . 图 2 显示 的 是 BONES 数据 文件 的 长 
宽 比 数据 . 选择 屏幕 底部 的 “ Variable View" 按钮 , 并 输入 每 个 变量 的 名 字 来 命名 变量 ( 列 ). 


















ltl dll 


图 E.1 SPSS 用 户 看 到 的 初始 屏幕 图 E. 2 将 数据 输入 到 SPSS 扩展 表 中 


如 果 数 据 保存 在 外 部 数据 文件 (例如 FISHDDT 数据 文件 ), 可 以 用 SPSS 提供 的 选项 来 访问 它 . 点 击 菜 
单 栏 上 的 “File” 按 钮 ,然后 点 击 “Read Text Data”, 如 图 E. 3 所 示 . 得 到 图 下 4 所 示 的 对 话 框 . f 


le 
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图 E.3 从 外 部 文件 读 取 数据 的 SPSS 选项 图 EE4 选择 外 部 数据 文件 
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指定 包含 数据 文件 的 磁盘 驱动 器 和 文件 夹 ,点击 数据 文件 , R Aik“ Open”, WE E. 4 所 示 ， 
这 将 启动 SPSS 文本 导 人 向 导 . 文本 导入 向 导 有 6 个 屏幕 菜单 , 第 一 个 如 图 EE.5 所 示 . 在 屏幕 上 作出 
合适 的 选择 , mdi" Net” 进入 下 一 个 屏幕 . 当 完 成 时 , sid; Finish". SPSS 扩展 表 将 再 现 来 自 外 部 数 
据 文 件 的 数据 , 如 图 E. 6 所 示 . 












图 E.5 SPSS 文本 导入 向 导 , 屏幕 1 — BEG 有 导入 数据 的 SPSS 扩展 表 


提示 : 可 以 选择 扩展 表 屏 幕 底 部 的 “ Variable View" 按钮 ， 并 键 人 每 个 变量 的 名 字 来 命名 变量 
( 列 ). 


E. 3 数据 列表 


为 了 得 到 数据 列表 (输出 ), 点 击 SPSS 主 菜单 栏 上 的 “ Analyze” 按 钮 , 然后 点 击 “Reports”, 再 点 
iti" Report Summaries in Rows" ( 见 图 E.7). 随后 得 到 菜单 或 者 对 话 框 如 图 E. 8 所 示 . 在 “Data Col- 
umns” 对 话 框 输入 想 输 出 的 变量 名 (可 以 简单 地 点 击 变 量 来 实现 ) , 然后 点 击 “OK”. 屏幕 上 出 现 输出 
结果 . 


i Report: Summaries in Rows 


ÍÀ location 











图 E.7 得 到 数据 列表 的 SPSS 菜单 选项 E.8 报告 数据 对 话 杠 





E4 图 示 数 据 
为 了 得 到 数据 的 图 形 描述 (例如 条 形 图 、 直 方 图 、 散 点 图 等 ) , 点 击 SPSS 菜单 栏 上 的 “Graphs" 按 
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` 钮 , 得 到 菜单 列表 如 图 E. 9 所 示 . 包含 在 这 个 文本 中 某 些 选项 是 “Bar( Chart) ” , “ Scatter ( plot)” , 
“Histogram” , “P-P”. 点 击 选择 的 图 形 查看 适当 的 对 话 框 . 例如 , 图 E. 10 RUE. 11 分 别 给 出 了 直方 
图 和 散 点 图 的 对 话 框 . 选择 合适 的 变量 ,点击 “OK" 查 看 图 形 . 











图 E.9 用 图 表示 数据 的 SPSS 菜单 选项 





ELE 10 直方 图 对 话 框 图 E11 散 点 图 对 话 框 


E.5 描述 性 统计 量 和 相关 


为 了 得 到 定量 变量 的 数值 描述 性 度量 ( 例如 均值 、 标 准 差 等 ) ， Fd; SEE CR BS " Analyze" 按钮 ， 
然后 点 击 “ Descriptive Statistics" ， 最 后 点 击 “ Descriptives" ( 见 图 E. 12). 随后 得 到 对 话 框 如 图 E. 13 
所 示 . 

选择 想 分 析 的 定量 变量 , 并 将 它们 放 入 “ Variable(s)" 框 中 . (可 以 点 击 对 话 框 中 “ Options ”按钮 
并 做 出 选择 来 控制 显示 哪些 描述 性 统计 量 . ) 点 击 “ OK 查看 描述 性 统计 量 的 输出 结果 . 

为 了 得 到 定量 变量 对 的 皮尔 逊 乘 积 矩 相关 ， 点 击 主 菜单 栏 的 ”Analyze”， 然后 点 击 “ Correlate” ( Wi, 
图 E. 12), 最 后 点 击 “ Bivariate” , 得 到 对 话 框 如 图 E. 14 所 示 . 

在 "Variables" 框 中 输入 感 兴趣 的 变量 ， 然后 点 击 “OK” 得 到 相关 的 输出 结果 . 


790 . HE š 

















图 E12 485HREEUETHRI SPSS 选项 
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图 下 13 描述 性 统计 量 对 话 框 图 E14 相关 性 对 话 框 





E.6 均值 的 假设 检验 


为 了 对 定量 变量 进行 总 体 均值 的 假设 检验 ,点击 SPSS 菜单 栏 上 的 “ Analyze" 按钮 ,然后 点 击 
“Compare Means”. 随后 得 到 的 菜单 如 图 E. 15 所 示 . 


E Untitled - S 











图 E15 均值 假设 检验 的 SPSS 选项 
点 击 感 兴趣 的 检验 查看 合适 的 对 话 框 . 例如 , 图 E. 16 和 图 E. 17 分 别 给 出 了 “One-Sample T 
Test” 对 话 框 和 “Independent-Samples T Test" 对话 框 . 对 于 单 样本 :检验 , E“ Test Variable(s)” 框 
中 指定 检验 的 定量 变量 , 在 “Test Value” 框 中 指定 原 假设 的 值 . 对 于 两 样本 检验 ,需要 在 
“ Grouping Varible” 框 中 指定 表示 两 个 样本 的 定性 变量 . 还 可 选择 点 击 “ Options” 框 并 做 适当 的 选 
择 得 到 均值 (或 者 均值 之 差 ) 的 置信 区 间 . 点 击 “OK” 查看 检验 结果 . 
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i Üne-Sample T Test 
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图 E16 均值 的 单 样本 :检验 对 话 杠 图 E.17 两 个 均值 的 独立 样本 :检验 对 话 框 


E7 分 类 数据 分 析 


SPSS 可 以 对 单 向 和 双向 ( 列 联 表 ) 表 进行 卡 方 检验 . 

单 向 表 

为 了 对 单 向 表 进 行 卡 方 检验 , 首先 访问 SPSS 扩展 表 文 件 ， 文件 包含 数据 集中 个 观测 值 的 类 型 
值 变 量 . (ix: SPSS 要 求 用 数值 (如 1, 2, 3 等 ) 指出 类 型 ， ) 然 后 , 点 击 SPSS 菜单 栏 的 “Analyze” 按 钮 ， 
再 点 击 “ Nonparametric Tests" 和“ Chi-Square” , 如 图 E. 18 所 示 . 

得 到 的 对 话 框 如 图 E. 19 所 示 . 在 “Test Variable List" 框 中 指定 感 兴趣 的 定量 变量 . 如 果 想 检验 原 
假设 中 相等 的 单元 概率 , E“ Expected Values" 框 下 选择 “All categories equal” 选 项 ( 如 图 E. 19 所 示 ). 


coupons - SPSS Data Editor ` 
Mew Data. Transorm [Anayse Graphs 





Wi Chi-Square Test 


p Expected Range — — p Expected Values 一 一 一 
(8. At categories equal 


(Caes | 





T 


图 下 18 单 向 卡 方 分 析 的 SPSS 菜单 选项 图 E.19 SPSS 单 向 卡 方 对 话 框 











如 果 原 假设 指定 不 等 的 单元 概率 , HNZ ZE“ Expected 
Values” 框 下 选择 “Values” 选项 . 在 相 邻 的 框 中 输入 原 
假设 的 单元 概率 , 每 次 一 个 , 在 每 次 指定 后 点 击 
" Add". 点 击 “OK” 得 到 SPSS 输出 结果 . — 
双向 表 - E — 
为 了 对 双向 ( 列 联 表 ) 表 进行 卡 方 检 验 , 首先 访问 包 i 
含 样本 数据 的 SPSS 扩展 表 文 件 . 数据 文件 应 该 包含 两 个 
对 数据 集中 个 观测 值 , 指出 每 个 观测 值 类 型 值 的 定性 变 
E. 然后 , 点 击 SPSS 菜单 栏 上 的 “Analyze” 按 钮 , 再 点 击 一 —— 
“Descriptive Statistics" X] Crosstabs" ， 如 图 E. 20 所 示 . 图 E20 双向 卡 方 分 析 的 SPSS 菜单 选项 









中- 1 Time sees 
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Paen S 21 中 给 出 . 在 “Row(s)” 框 中 指定 一 个 定性 变量 , 在 “Column(s)” 框 中 
指定 另 一 个 定性 变量 . 点 击 “Statistics ”按钮 , 选择“ Chi- -square "选项 , 如 图 E. 22 所 示 . 点 击 “ Continue” 
回 到 “ Bee 如 果 和 希望 列 联 表 包含 期 望 值 、 行 百分率 ， 和 /或 列 百分率 . 点 击 “ Cells" fz 
钮 ,选择 恰当 的 菜单 . 回 到 “Crosstab” 菜 单 屏 幕后 , 点 击 “OK” 得 到 SPSS 输出 . 

xi 





E.21 SPSS 的 交叉 分 组 表 对 话 杠 HE E22 双向 表 分 析 的 SPSS 统计 量 菜单 选项 


[ ik; 如 果 SPSS 扩展 表 包 含 汇总 信息 (例如 列 联 表 的 单元 计数 ) ， 而 不 是 每 个 观测 值 的 实际 类 
型 数据 值 , 在 运行 卡 方 分 析 之 前 ，， 必须 以 观测 值 的 单元 计数 为 权 对 数据 文件 中 的 每 个 观测 值 加 
Bt. 这 可 由 选择 SPSS SE 8.22 BJ“ Data" 按钮 ， 然 后 点 击 “ Weight Cases" ， 并 指定 包含 单元 计数 的 变 
量 来 完成 . ] 


E.8 简单 线性 回归 和 多 重 回归 


进行 一 般 线性 模型 的 回归 分 析 , 点 击 SPSS 菜单 栏 E" Analyze" 按钮 ,然后 点 击 “Regression”， 最 
后 点 击 “Linear”, 如 图 E. 23 给 出 . 随后 得 到 对 话 框 在 图 E. 24 jisai 











图 了 .23 回归 的 SPSS 选项 BLE.24 线性 回归 对 话 框 


TE" Dependent" 框 中 指定 定量 因 变量 , ZE“ Independent(s)” 框 中 确定 自 变量 . 在 Method” 栏 中 保 

证 选择 “Enter”.( 注 : 如 果 模 型 包含 交互 作用 项 和 /或 平方 项 , 必须 在 运 运行 回归 分 析 之 前 , 在 SPSS 扩 

展 表 文件 中 创建 并 添加 这 些 高 阶 变量 . 可 以 点 击 主 菜单 上 的 “ Transform ”按钮 ,选择 “Compute” 选 项 做 
到 这 点 . ) 
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还 可 以 选择 点 击 “Statistics” 按 钮 ， 并 在 随后 所 得 的 菜单 列表 中 选择 恰当 的 项 , 用 SPSS 得 到 模型 
参数 和 方差 膨胀 因子 的 置信 区 间 . 也 可 以 点 击 “Save” 按 钮 ， 并 在 随后 所 得 的 菜单 表 恰当 的 项 中 打 钩 
得 到 预测 区 间 . (预测 区 间 将 作为 新 的 一 列 加 到 SPSS 数据 扩展 表 中 . ) 点 击 “Plots” 按 钮 并 在 随后 得 到 
的 菜单 中 作 恰 当 的 选择 , 可 以 得 到 残 差 图 . Fili" Continue" , 从 这 些 选 项 屏幕 的 任何 一 个 回 到 “Re 
gression” 的 主 对 话 框 . 在 “Regression” 对 话 框 中 点 击 “OK”， 看 到 线性 回归 的 结果 . š 

另外 , 可 点 击 SPSS 主 菜单 栏 中 的 Analyze" j£ £l, 再 点 击 “General Linear Models”, 最 后 点 击 
“Univariate” 拟 合 一 般 线性 模型 ， 如 图 E. 25 中 所 示 . 随后 得 到 对 话 框 在 E. 26 中 给 出 . 











图 E. 25 拟 合 一 般 线性 模型 的 SPSS 选项 图 FE.26 一 般 线性 回归 模型 对 话 框 


在 "Dependent” 框 中 指定 因 变量 , 在 “ Covriate (s)" 框 中 指定 模型 中 定量 自 变量 ,在 “Fixed 
Factor( s) ”中 指定 定性 自 变量 . ( 注 : SPSS 对 每 个 指定 的 定性 变量 将 自 动产 生 恰当 个 数 的 虚拟 变量 . ) 
做 完 变量 选择 后 , 点 击 “Model” 按 钮 , 可 以 看 到 图 E. 27 给 出 的 对 话 框 . 





[xj 





4d length"weight 
| species 


图 E.27 选择 模型 项 的 对 话 杠 


选择 Custom” 选项 ， 然后 点 击 每 个 项 选择 模型 中 的 项 . 由 着 重 显示 变量 , 然后 点 击 “ Inter- 
action” 按 钮 指定 交互 作用 . (z. 必须 用 “Transform” 按 钮 预先 创建 平方 或 高 阶 项 . ) 模 型 项 将 出 
现在 “ Model” HE H. 点 击 “ Continue" 回 到 “General Linear Models" X it f£ ( E] E. 26). 点 击 “ Op- 
tions" 按钮 , 在 随后 所 得 的 菜单 中 在 “Parameter REstimates” 处 打 钩 给 出 模型 参数 的 估计 值 . 点 击 
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“Save” 按钮 并 作 恰 当 的 选择 , 保存 预测 值 和 残 差 . 检查 要 求 的 所 有 选项 后 , nah OK" 查看 多 重 
回归 的 结果 . 


E.9 逐步 回归 


为 进行 逐步 回归 分 析 , 点 击 主 菜单 栏 中 的 “Analyze” 
按钮 , 再 点 击 “ Regression” , 然后 点 击 “Linear”， 如 图 
E. 23 中 所 示 . 随后 所 得 对 话 框 在 图 E. 28 中 给 出 . 在 “De- 
pendent” 框 中 选 定 因 变 量 , 在 “Independent(s)” 框 中 选 定 
逐步 模型 中 的 自 变量 . 现在 点 击 “ Method "按钮 ,选择 
“ Stepwise” 选项, 如 图 E. 28 所 示 . (i£; SPSS 中 没有 所 有 
可 能 的 回归 选择 方法 . ) 

作为 一 个 选项 , 可 以 点 击 “Options” 按钮 , 并 指定 一 
个 值 来 选择 分 析 中 所 用 的 a 值 . (默认 为 a=0.05) 点 击 
“OK "查看 逐步 回归 的 结果 . 


E.10 ” 残 差分 析 和 影响 诊断 


为 进行 残 差 分 析 , 点 击 SPSS 主 菜单 栏 的 “Analyze” 按 钮 , 再 点 击 “Regression”, 然后 点 击 “Linear”, 如 
图 E23 所 示 . 随后 所 得 对 话 框 在 图 E. 24 中 给 出 . 在 ”Dependent” 框 中 选 定 因 变量 , “Independent (s) "fE rf 
选 定 模 型 中 的 自 变量 . 点 击 “Plots” 按 钮 , 生成 残 差 图 . 随后 所 得 菜单 如 图 E. 29 中 所 示 . 

选择 适当 的 变量 作为 “Y” 轴 和 “X” 轴 得 到 残 差 散 点 图 . (图 E. 29 给 出 的 选项 产生 残 差 对 预测 值 
的 残 差 散 点 图 . ) 也 可 以 在 适当 的 框 中 打 钧 得 到 残 差 的 直方 图 和 正 态 概率 图 . 点 击 “ Continue” 回 到 线 
性 回归 主 菜单 , 然后 点 击 “OK” 查 看 残 差 图 . 

点 击 “ Linear Regression” 对 话 框 中 的 “Save” 按钮 ,进行 影响 诊断 (图 E. 26). 随后 所 得 菜单 在 图 
E. 30 中 给 出 . 





E.28 逐步 回归 菜单 选项 


Linear Regression: Plot: 
bi ^ 





图 EE.29 多重 回归 的 残 差 图 菜单 选项 图 E30 线性 回归 的 保存 菜单 
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点 击 想 保存 的 影响 诊断 (如 “Cooks” 和 “ Leverage" ) ,然后 点 击 “Continue” 回 到 “Linear Regression” 
对 话 框 . MERE OK”, 影响 诊断 将 作为 附加 列 出 现在 SPSS 扩展 表 中 . 
E.11 单 向 方差 分 析 


对 完全 随机 化 设计 进行 单 向 ANOVA, 点 击 SPSS 主 菜单 栏 的 “Analyze” 按 钮 ， 然后 点 击 
" CompareMeans" , 最 后 点 击 “One-Way ANOVA”, 如 图 E. 31. 随后 所 得 的 对 话 框 在 图 E. 32 中 给 出 . 
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图 E31 单 向 方差 分 析 的 SPSS 选项 图 E.32 单 向 ANOVA 对 话 框 


TE“ Dependent List" 框 中 选 定 因 变 量 , 在 “Factor" 框 中 指定 代表 单个 因子 的 定性 变量 为 进行 处 理 
均值 的 多 重 比较 , 点 击 “Post Hoc” 按 钮 得 到 图 E. 33 所 示 的 对 话 框 . 在 这 个 框 中 , 选择 比较 方法 (如 
Bonferroni) 和 比较 的 错误 率 ( 如 0.05 的 显著 性 水 平 ). 点 击 “Continue” 回 到 “One-Way ANOVA” 对 话 框 
"OB E 32). 

为 进行 方差 相等 性 检验 , it“ One-Way ANOVA” 对 话 框 的 “ Options ”按钮 , 得 到 图 E. 34 给 出 的 
菜单 . 从 这 个 菜单 中 选择 “ Homogeneity of variance test" , 然后 点 击 “Continue” 回 到 “One-Way ANOVA” 
对 话 框 (图 E. 32). 点 击 “ OK” 查 看 ANOVA 结果 . 


y ANOVA: Post Hoc Multiple Comparisons [x1 





R E.33 均值 多 重 比较 对 话 框 图 EE.34 单 向 ANOVA 选项 菜单 


E.12 析 因 设计 和 其 他 设计 的 方差 分 析 


为 进行 析 因 设计 的 ANOVA, 点 击 SPSS 主 菜单 栏 的 “ Analyze”, 然后 点 击 “General Linear Model” , 
最 后 点 击 “ Univariate” ( 见 图 E. 35). 随后 得 到 的 对 话 框 在 图 E. 36 中 给 出 . 
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图 EE.35 析 因 设计 方差 分 析 的 SPSS 选项 Ed E.36 析 因 ANOVA 对 话 框 


在 “Dependent” 框 中 指定 因 变量 , 在 “ Fixed Factor(s)” 框 中 指定 表示 因子 的 定性 变量 . 点 击 “Mod- 
el” 按 钮 ,指定 因子 模型 . 出 现 图 E. 37 所 示 的 对 话 框 . 对 包含 所 有 可 能 主 效应 和 交互 作用 的 模型 选择 
“Full Factorial” I. 点 击 “ Continue” 回 到 “Factorial ANOVA” 对 话 框 (图 E. 36). 

点 击 “ Factorial ANOVA” 对 话 框 中 的 “ Post Hoc" 按钮 ， 运行 处 理 主 效应 均值 的 多 重 比较 . 出 现 图 
E. 38 所 示 的 对 话 框 . fE“ Post Hoc Tests for” 框 中 指定 检验 的 主 效应 , 并 选择 比较 方法 (如 Bonferroni) , 
然后 点 击 “ Continue” 回 到 “Factorial ANOVA” 对 话 框 (图 E. 36). 


Univariate: Model Univanate. Post Hoc Multiple Comparisons for Übserved Means 





图 E37 析 因 模型 选择 对 话 框 E.38 ”因子 均值 多 重 比较 对 话 框 


( 注 : 点 击 “Factorial ANOVA” 对 话 框 的 “Options”, 并 在 随后 得 到 的 菜单 中 选择 Homogeneity 
tests" , 进行 方差 相等 性 检验 ) 点 击 “Factorial ANOVA” 对 话 框 上 的 “OK” (图 E.36) 运 行 并 查看 
ANOVA 结果 . 


E 13 ” 非 参 数 检验 


符号 检验 或 符号 秩 检验 

包含 样本 数据 的 SPSS 扩展 表 文 件 应 该 包含 两 个 定量 变量 . ( 注 : 对 符号 检验 ， 一 个 变量 是 待 分 
析 的 变量 , 另 一 个 变量 是 所 有 观测 值 的 假设 中 位 数值 . 对 符号 秩 检验 , 这 两 个 变量 表示 配对 差 中 的 
两 个 变量 . ) 点 击 SPSS 菜单 栏 中 的 Analyze" 按钮， 再 点 击 “Nonparametric Tests” 和 “2 Related Sam- 
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ples", 如 图 E. 39 所 示 ， 

随后 所 得 的 对 话 框 在 图 E. 40 中 给 出 . 选择 感 兴趣 的 两 个 定量 变量 , 使 得 差 出 现在 “Test Pair( s) 
List" f£ rp. 在 “Test Type” 下 ,对 符号 检验 选择 “Sign" 选 项 ， 对 符号 秩 检验 选择 “ Wilcoxon” 选项. 点 击 
“OK "生成 SPSS 输出 结果 . 








= Two-Related-Samples Tests 
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图 EE.39 符号 检验 或 符号 秩 检验 的 SPSS 菜单 选项 图 E.40 SPSS 的 两 个 相关 样本 对 话 框 


秩 和 检验 

包含 样本 数据 的 SPSS 扩展 表 文 件 应 包含 一 个 定量 变量 和 有 两 个 数字 编码 值 ( 如 1 或 2) 或 两 个 
简短 分 类 水 平 ( 如 “是 ”和 “和 否 ” ) 的 定性 变量 . 这 两 个 值 表示 被 比较 的 两 个 组 或 总 体 . 点 击 SPSS 菜单 
栏 中 的 “Analyze” 按 钮 , 然后 点 击 “ Nonparametric Tests” 和 “2 Independent Samples" ( 见 图 E. 39). 随后 
所 得 对 话 框 如 图 E. 41 中 给 

在 “Test Variable List” 框 中 指定 感 兴趣 的 定量 变量 , fE“ Grouping Variable” 框 中 指定 定性 变量 . 点 
ir“ Define Groups” 按 钮 , 在 随后 所 得 的 对 话 框 中 指定 两 个 组 的 值 , 然后 点 击 “ Continue” 回 到 “2-Inde- 
pendent-Samples” 对 话 屏 . 在 “Test Type" F, 选择 Mann-Whitney U” 选 项 , 然后 点 击 “OK” 产生 SPSS 
输出 . | 

克 鲁 塞 - 沃 里 斯 检验 

包含 完全 随机 化 设计 数据 的 SPSS 扩展 表 文 件 应 包含 一 个 定量 变量 ( 响应 变量 或 因 变 量 ) 和 一 个 
至 少 两 水 平 (这 些 值 必须 是 数字 , 如 1、2、3 等 等 . ) 的 因子 变量 . 点 击 SPSS 菜单 条 中 的 “ Analyze” 按 
H, 然后 点 击 “ Nonparametric Tests" 和 “ K Related Sample”( 见 图 E. 39). 随后 所 得 的 对 话 框 在 图 E. 42 
中 给 出 . 

在 “Test Variable List” 框 中 指定 响应 变量 , 在 “ Grouping Variable” 框 中 指定 因子 变量 . 点 击 “ Define 
Range" 按钮 ， 并 在 随后 所 得 的 对 话 框 中 指定 分 组 因子 的 值 . 然后 点 击 “ Continue" $, [8| | ^K Inde- 
pendent variable” 对 话 屏 幕 . 在 “Test Type "下 选择 “ Kruskal-Wallis ”选项 ， 然 后 点 击 “OK” 产 生 SPSS 
输出 . 

弗 里 德 曼 检验 

包含 随机 化 区 组 设计 数据 的 SPSS 扩展 表 应 包含 表示 被 比较 的 个 处 理 的 个 定量 变量 . (x. 
在 行 表 示 区 组 的 情况 . ) 点 击 SPSS 菜单 栏 中 的 “Analyze” 按钮 > 然后 点 击 “ Nonparametric Tests" 和 “KK 


798 HE 





E 


Related Sample" ( 见 图 E. 39). 随后 所 得 对 话 框 如 图 E. 43 所 示 . YE" Test Variable” 框 中 指定 处 理 变 量 ， 
TE" Test Type” FAF“ Friedman” AM, 点击 “OK” 产 生 SPSS 输出 . 





E.41 SPSS 的 两 个 独立 样本 的 对 话 框 图 FE.42 SPSS K 个 独立 样本 框 


秩 相关 f 

为 得 到 感 兴趣 的 两 个 定量 变量 的 斯 皮尔 曼 秩 相关 系数 ， 点击 SPSS 主 菜单 栏 中 的 * Analyze" FER, 
然后 点 击 “Correlate” 和 “Brivariate”. 随后 所 得 对 话 框 在 图 E. 44 中 给 出 . 在 “Varibale” 框 中 输入 感 兴趣 
的 变量 , TE" Correlation Coefficents" F1] 45^ Spearman” 4T, 然后 点 击 “OK” 产 生 SPSS 输出 . 


Bivariate Correlations 











图 E.43 SPSS 天 个 相关 样本 对 话 框 图 E.44 SPSS 相关 对 话 框 


E 14 控制 图 及 能 力 分 析 


为 了 创建 过 程 数 据 控制 图 , 首先 访问 包含 质量 数据 的 SPSS 扩展 表 文件 . 然后 , 点 击 SPSS 菜单 栏 
中 的 “Graphs” 按 钮 , 再 点 击 “Control” 如 图 E. 45 所 示 . 随后 所 得 对 话 框 在 图 E. 46 中 给 出 . 选择 想 产生 
的 控制 图 的 类 型 (individuals, x-bar, R-, p- 或 c-chart) , 以 及 扩展 表 中 的 事件 ( 行 ) 表示 是 单个 质量 测 
量 值 (“Cases are units”) 还 是 子 组 (“Cases are aubgroups" ) ,然后 点 击 “Control Chart" 对 话 框 中 的 “De- 
fine" £H. . 

如 果 选 择 事 件 是 子 组 的 x-bar R E, 那么 将 出 现 图 E. 47 中 给 出 的 对 话 框 . 如 果 选 择 事 件 是 个 
体 单元 的 x-bar sk R E, 出 现 图 E. 48 中 给 出 的 对 话 框 . 做 恰当 的 选择 ( 过 程 变 量 或 子 组 变量 ), 然后 
ski" OK" 生成 SPSS 控制 图 . 作为 一 个 选择 , 可 以 点 击 “Statistics” 按 钮 并 进行 适当 的 菜单 选择 (规格 
限 、 目 标 值 和 C 统计 量 ) 进 行 能 力 分 析 . ( 见 图 E. 49. ) 
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图 下 47 SPSS 的 x-bar 图 与 尺 图 选项 (事件 是 子 组 ) BLE 48 SPSS 的 x-bar 图 与 丸 图 选项 (事件 是 单元 ) 


如 果 在 “Control Charts” 对 话 框 (图 E. 46) 中 选择 p 图 或 图 , 出 现 类 似 图 E. 50 所 示 的 对 话 框 . 指 
定 表示 不 合格 个 数 的 变量 和 子 组 ， 指定 样本 量 . 点 击 “OK” 查 看 SPSS 控制 图 . 


X-Bar, R, s: Statistics 


anmann 





图 E.49 SPSS 能 力 分 析 菜 单 选项 





图 E50 pif] SPSS 选项 
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E.15 ”随机 抽样 和 随机 数 发 生 器 


随机 抽样 
为 了 从 储存 在 SPSS 扩展 表 的 数据 集 中 得 到 观测 值 的 随机 样本 ， 点 击 SPSS 菜单 栏 中 的 “Data” 按 
H, 然后 点 击 “ Select Data” 如 图 E. 51 所 示 . 图 E. 52 给 出 随后 所 得 的 对 话 框 中 , 点击“ Random sample 


of cases” 和 “Sample” 按 钮 . 
Paint125.sav - SPSS Data Editor 








图 E. 51 对 数据 进行 抽样 的 SPSS 菜单 选项 图 忆 52 选取 一 个 随机 样本 的 SPSS 选项 


然后 , 在 下 面 的 对 话 框 中 (图 E. 53) 指 定 希 望 在 你 的 样本 中 选择 多 少 事件 . 点 击 “ Continue”, 然 
后 “OK”, 在 一 个 新 扩展 表 中 产生 随机 样本 . 


随机 数 发 生 器 

为 了 从 指定 的 概率 分 布 中 产生 观测 值 的 随机 样本 , 点 击 SPSS 菜单 栏 中 的 “Transform” 按 钮 , 然后 点 击 
"Compute" , 出 现 图 E. 54 所 示 的 对 话 框 . TE" Function Group” 框 中 选择 “Random Numbers" , 然后 点 击 选 择 的 
概率 分 布 ( 如 “Rv: Normal") ,如 图 E. 54 所 示 . 在 “Numeric Expression” 框 中 输入 分 布 参数 (如 均值 和 标准 
差 ) 的 值 , 然后 点 击 "OK”. 随机 样本 值 出 现在 SPSS 扩展 表 由 “Target Variable” 指 定 的 列 中 . 


Mi Compute Variable 





mg Select Cases: Random Samp 











E. 53 SPSS 随机 样本 对 话 杠 BESA SPSSTHON MARE 
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第 1 章 


poa 平板 b 总 体 : WARE SI 类 型 环 氧 层 的 


平板 | 
a. 所 有 可 能 的 每 天 的 周围 空气 样本 
b. 13 天 测量 硫 含量 的 13 个 空气 样本 


w 


.5 a. 所 有 美国 的 计算 机 电源 系统 站 点 


b. 此 项 研究 中 的 146 个 美国 站 点 e 估计 所 有 
站 点 的 10% 处 于 高 的 中 性 线 电流 状态 


Doa 一 氧化 碳 气 体 的 水 平 ; 气象 台 的 一 周 


b. 总 体 


.9 a 定性 b 定性 c 定量 d 定量 


e 定量 f 定量 g 定量 h 定性 


MO 比例 : 定量 ; 负载 类 型 : 定性 ; EE: 定性 
.13 a 定量 b. 定量 c. 定量 d 定性 


e. 定性 


.15 a. 所 有 硬件 b. 测试 寿命 长 度 的 100 个 计算 


机 元 件 c 定量 d. 估计 所 有 元 件 的 平均 寿 
fp I BE 


-17 a2mL 的 清洁 溶液 b 为 了 中 和 溶液 所 必需 


的 盐酸 量 c. 所 有 可 能 的 2 mL 的 清洁 溶液 
d. 化 学 家 制备 的 5 份 2 mL 溶液 


D a 工科 大 学 生 b 总 体 : 所 有 宾夕法尼亚 州 


的 工科 大 学 生 ; 样本 : 此 研究 中 选 出 的 21 名 
工科 大 学 生 c 定量 d 估计 宾夕法尼亚 州 
所 有 大 学 生 的 平均 佩 里 得 分 为 3. 27 


21 a 桥梁 的 结构 状态 b. 定性 e 总 体 


d. 观测 研究 
第 2 章 


.3 a 热 区 ; 定性 ; 海滩 条 件 . 定性 ; 堤坝 条 件 : 定 


性 ; 腐蚀 率 : 定量 

5 b. 来 自 未 知 来 源 攻击 的 百分比 在 1999 年 到 
2001 年 之 间 有 了 增加 

7 b 不 支持 

11 e.0.444 

13 a.65% b.12% 

15 b.0.966 


2.51 


2.53 
2. 59 
2. 61 
2. 65 
2.67 
2. 69 


2.71 
2. 73 


= 
co 
a.0.26 b.0.086 
a.130 c.0.079 


a 6; 5; 全 部 b.6; 5.5; 4 816 

2.425; 2; 2; 均值 

老 地 方 : 9.804, 9.975. JL x3; 新 地 方 ， 
9.422, 9.455, 8. 82 

0.333; 0 .270; 0 .270; 均值 

a. 均值 = -0.15; 中 位 数 = -0.11; 没有 众 数 
c 均值 = -0.12; 中 位 数 = -0.105; 没有 
众 数 

a.0.18 b.0.0041 c.0.064 d. 早上 

b. (0.1515, 1.534) c. 近似 为 95% 

d. 9196 

a. ( -0. 900, 2.900) b. ( 16.220, 25. 340) 
(204. 815, 264. 665) 

a. 是 b.(24557, 29677) c.27117 

75% 的 TP 浓度 在 10 mg/L 以 下 

az= -4.66 bz= -0.32 

3.1.2 b.2.25 c. 老 地 方 

a. 50% 烧 砖 的 钢 值 在 170 mg/kg 以 下 b. 2595 
入 砖 的 钢 值 在 115 mg/kg UF c. 7595 烧 砖 的 
BMÉTE260 mg/kg 以 下 d.145 e( - 102.5, 
477.5) f 没有 异常 值 

a 是 ; 疑似 : 10.55; 高 度 疑似 : 8.05, 8.72, 
8.80 b.8.72, 8.80 c 没有 d RAR 
常 值 


能 , z= -2.5 
(0.833, 2.929) 
1. 06 


d.y-62.96,5-0.61 e.96.97% ; 是 
z=2.3; 不 能 

a. 海 网 和 长 度 : 定量 ; 右 油 : 定性 b. REA 
c. 有 油 区 域 : 3895; 无 油 区 域 . 62% e. 分 布 
相似 f (0, 16.67) g.(0,15.43) h. 无 油 
区 域 

a. 搁浅 b.y=59.82,s=53.36; (0, 166. 54) 
a. 定量 b. 频数 分 布 ec 0.28 d. 是 
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19 
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43 
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第 3 章 ' 

a. 学 校 试验 室 、 运 输 途 中 、 化 工厂 、 非 化 工厂 
等 b0.06, 0.26, 0.21, 0.35, 0.12 c.0.06 
a. 非 绿色 者 、 真 诚 绿色 者 、 钞 票 绿色 者 、 新 绿 
色 者 和 抱怨 者 .bb.0.28, 0.11, 0.11, 0.26, 
0.24 c.0.52 d.0.48 

a. Pu/B/BL, Pu/B/D, Pu/U/BL, Pu/U/D, Pr/ 
B/BL, (Pz/B/D, Pr/U/BL, Pr/U/D. 其 中 Pu: 公 
用 井 ; )Pr: 私 用 井 ; B: 基 岩 ; U: 松散 的 ; BL; 
低 于 限制 的 ; D: 检 测 到 的  b.0.256, 0.184, 
0.067, 0.031, 0.363, 0.099, 0,0 e 0.314 


2.0.261 b. B[ T: 0.85; 树叶 ， 0.10; $ 
Ë : 0.05 

a. 0. 286 

3.0.56 b.0.94 

0. 711 


a. 32 个 简单 事件 : FFFFF, FFFFW, -.., WW- 
WWW b.0.96 c.P(F)-001, P(W) = 
0. 99; 简单 事件 不 是 等 可 能 的 

a. AC, AW, AF, IC, IW #I IF. 其 中 A: 使 
用 的 ; T; 不 用 的 ; C: 沉 箱 ; W: 油井 保护 器 ; 
F: 固定 的 栈桥 b.0. 148, 0.066, 0.425, 
0.176, 0.052, 0.132, 0.324, 0.118, 0. 558 
c€.0.64 d.0.118 e.0.148 f.0.786 g.0.676 
0. 984 

P(AIB) =0 

a. 0. 7628  b.0. 1445 

a. 0.974 b.0.12 

0. 559 

a. 6/60 b. 9/40 

0. 81 

a. P(AII) 20.9, P(BII) 20.95, P(AIN) = 
0.2,P(BIN) 0.1 b.0.855 c€0.02 d.0.99 
a.0.122 b.0.719 c.0.682 

a.0.116 b.0.728 

a. 0.01099 b. 0. 000000001 

3.0.09 b.0.516 

3.0.158 b.0.316 c.0.526 d.#3 

0. 2362, 0. 1942, 0. 5696 

a.18 b.4/18 

a.24 b.100 

a.l6 b.24 


D ot t 9 1 Q 


2 2 b 2 


P > t > 


ae F = > >= > > =F = += = 


55 
57 
59 
61 
63 
65 


. 73 


75 
77 
79 
81 
83 


85 
89 
91 
93 


a.729 b.120 
a.168 b.8/168 
63 063 000 
a.63/1326 b. 0. 0465 

如 果 声 明 是 真 的 , Pm SEG ES) =0. 039 
a. 不 合理 ; 如 果 p =0.45, P(3 次 没有 击 中 ) = 
0.166 b. 合理 ; 如 果 p =0.45, P(10 次 没有 
击 中 ) =0. 0025 

a.8 个 行为 /查询 b.0.252, 0.190, 0.124, 
0.159, 0.046, 0.095, 0.075, 0.058 c. 0. 283 
d. 0. 925 
a. 0. 92 
a. 1440 
a. 0. 12 


c. 2/7 


b.1 

b. 240 

b. 0. 473 

a.0.06 b.0.94 

a.0.85 b.0.40 c.25 个 简单 事件 d P(O, 
0) 20.36, P(0, 50) 20.06, 45^$ e 0.64 
26 

a 60 b.3/5 c.3/10 

a.0.0019808 b. 0. 00394 c. 0. 0000154 

P( 在 10 亿 次 除法 中 至 少 出 现 1 次 错误 ) 
=0. 105 


第 4 章 
ap(1) 20.4, p(2) 20.54, p(3) = 0.02， 
p(4) 20.04 b.0.06 
a.0.22 b.0.081 c.0.77 
a0, 1,2 b.p(0) 2 5/8, p(1) = 2/8, 
p(2) 21/8 
b.0.85 €0.6,0,0,0,0.7 d 0.51 
e. 0. 0225 
p(1) 23/5, p(2) 23/10, p(3) =1/10 
a.1.8 b.0.99 c.0.96 
0. 29 
a.2.9;3 b.3;4 c3;3 
u 73600 美元 , o° 23920000. (0, 7559. 80) 
5.9938 
a. (20.25 (0.75)? b.0.2637 c. 0. 6328 


0. 1394 

0. 049 

0. 9957 

a. 0. 1719 


J B 
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' 4.35 
4.41 
4.43 


4.45 
4.47 


4.49 


4.51 
4.53 
4.55 


59 
61 
63 
65 
67 
69 
71 
73 
77 
83 


BOROR = BOR > > > = 


85 
87 
89 
91 
93 
95 


> # + = =F = 


97 
99 


= = = = 


101 
103 NASA: 0.0004; 空军 : 0.5155; 空军 更 合适 


a.0.001 b. 有 可 能 
a.0.0001139 b. 0. 0355 
a. 0. 0000003 b. 23. 5 
d. (16.44, 30. 56) 

a. 0.0319 b. 0. 0337 
n(4p, +p) 

a. ( R2} )0. 200.807" b.50 c. 0.0047 


c. 12. 455 


c. 5.2 


a.3.73 b.0. 26788 c.0.04125 
a.0.113 b.0.792 c.0.208 

a.0.657 b.u 23.33, 0 -2.79 c. 不 可 能 
d. 0.671 

0. 2693 

a.0.0883  b.0. 1585 

0. 467 
a.0.197 b.0.112 c.0.038 
0. 551 
0. 028 

a. 0.03 c.0.97 

a. 0. 2052 b. 0. 5438 
a. 0.0081 b.u>4 
a. p(0) =0. 004096, p(1) =0. 064512, p(2) = 
0. 338688, p(3) =0. 592704 

a.0.027 b.0.432 c.0.648 


€. 不 (z=2. 85) 


a.0.189 b. ~0 cp«0.95 
a.0.7763 b.0.1118 

a.4/7 b.4/35 

u 263000, o? -61321000000 

a. p(y) 2(0.001)(0.999)"^! b.0.995 
c. 没有 根据 

a.0.402 b.0.161 

0.263 


&,-715,0 =3.87 b. ~0 c RAM, 较 小 


第 5 章 


a.1⁄8 bF(y)-y/8 el/8 d.0.0156 
e. 0. 2969 


al hF(y)-1-e" c09257 e.0.3611 
1)2⁄2 0 
a1 bP) -人 i y< 
[y(2-y) +1]/2, y>0 


c.0. 125 d. 0.3894 


ap =0, 0 =5 bp=0, o =0.0014 c= 


M t (A fA a 


DA D tA fA D tA 


tA DA D tA A D fA (A tA 


A tn CA D LA 


CA tA LA XA fA JA CA (A 


. 13 


15 
17 
19 
23 
25 
27 


29 
31 
35 
37 
39 
41 
43 
45 
47 


49 
51 
57 
59 


61 


67 
69 
71 
79 
81 
83 
85 
87 


89 
91 
93 
95 
97 


. 99 


0, o? =18000 
a.u 20.5, o 20.289, P. 20.10, Q, =0.25, 
y =0.75 
a =7.o=0.29 b.0.3 
0. 4444 
b.a+(b-a)y 
a. 0. 8413 b. 0. 7528 
a.0.7176 b. 不 能 ; z= -3.85 
2.0.3755 b.0.1969 c.0.9693 
d.0.9292 e.1666.875 
d =56. 24 
a.0.9406 b. 0. 0068 
a. 了 有 比 正 态 分 布 较 小 的 变化 b. 多 于 
IQR/s =1. 34 
a. IQR/s =1.22 b.IQR/s =0. 098; 不 是 正 态 
不 是 正 态 
a.0.449 b. 0. 865 
0. 4346 
3.0.3679 b. 0. 6065 
d. 0. 0041 
a.0.082 b.8»24 
1/16 
0. 3935 
a. u =5.65, g? 31.9225 hb 0.6542 c. 0. 1703 


a. (0.88623)/8 b. (0.2146)8 

c. exp( - C/B) 

a. u =0. 0385, 92 =0. 00137 b. 0. 778 
a. 0.834 b. 0. 006 

168 

3.0.0694 b. 0. 4402 

a. 10 b.0.05 c 声明 不 真 

不 可 能 ; P-0.0154 

3.20 b.0.2231 c.0.0498; 0. 9502 
a.0.5507 b.0.2636 c.u=60, 
o2=1800 d.0.0916 

a.0.321 b.0.105 

109. 02 

不 能 

1⁄6 

a a=9, B=2_ b. =0.818, o? =0. 0124 
c. 0. 624 
a. 0. 9671 


c. 0. 1353 


b. 0.2611 c. 不 能 
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6.11 
6.13 


DAD m m m S m m Ps S m m = = P> > > 
Uu 
~ 


6. 67 


第 6 = 


b.p1(0) =0.3, p;(1)—0.1, p1(2) =0.025, pl(3) =0.3, p1(4) =0.125, pi(S) =0.15 c. pz(0) =0.1, pz(1) =0.55, 
p2(2) =0.35 qd. p1(0|0) = 0, p,(1l0) =0.5, p1(210) =0.25, p/(3|0) = 0, p,(4l0) =0.25, pi(5l0) = 0; 
Pp1(0|1)=0.364, pi(1|1)=0.091, pi (2|1) = 0, p1(3|1) =0.545, p,(4l1) = 0, pi(5l1) = 0; p1(0|2) =0.286, 
Pi(lP) = 0, pi(212) = 0, p1(3l2) = 0, pi (4|2) =0.286, p1(512) =0.429 e. pa(0|0) = 0, ps( 1|0) —0.667, 
px(210) -0.333; p>(0]1) =0.5, pz(1|1) 20.5, p;(2I1) = 0; pz(02) = 1, p2(1|2) = 0, p>(2|2) = 0; pz(03) = 0, 
p2(1]3) = 1, p2(2]3) = 0; pa(0|4) =0.2, p2(1|4) = 0, pz(214) =0.8; pz(015) = 0, px(1|5) = 0, p2(2|5) = 1 
a.p(0,0) = 0, p(0,1) = 0, p(0,2) = 1/28, p(1,0) = 0, p(1.1) = 6/28, p(1.2) = 6/28, p(2,0) = 3/28, 

p(2,1) = 9/28, p(2,2) = 3/28 b.p2(0) = 3/28, p2(1) = 15/28, pz(2) = 10/28. e. pi(0|0) = 0, p, (110) = 0, 
pi(210) = 1; pi(0l1) = 0, pi(1h1) = 6/15, pi(2l1) = 9/15; pi(012) = 1/10, p,(1|2) = 6/10, p) (2|2) = 3/10 
a. p2(0)=0.11, p2(1) —025, p;(2) =0.40, pz (3) =0.24 b. p;(0[2) —0.175, p>(1|2) =0.25, pz(2|2) =0.375, 
p;(3l2) =0.20 

a-p(L1) = 0, p(1,2) = 1/3, p(1,3) = 0, p(2,1) = 1/3, p(2,2) = 0, p(2,3) = 0, p(3,1) = 0, p(32) = 0, 
p(3.3) = 1/3 


b. 0.4624 6.69 a 近似 正 态 , u, = 77.02, o, =3. 49 
ad 40 -(3--5) c.f (ly) = (x — n b. 0. 9778 c. 个 是 ,z= 73.10 
. c. 近似 正 态 ， H; 751, o; =2.09 
7)/(3/2 -y) b.0.3156 ¢.0.1694 
a.l bfi) =e e.f(y) - e” d.fi&b) ^ 673 a60,36 b. EX c ~0 
e^ e.f(yx)-e? f. 0.399 6.77 a 不 能 b. fE c. fii 
a 1.5 b.1.25 6.79 «0 
a.0 b.30 6.81 可 能 ; P( Y>20) =0. 1762 
al bl c2 dl 6.83 0.9951 
不 独立 6.85 a.300 b.800 c. «Il 
不 独立 6.87 a.9 个 自由 度 的 学 生 了 分 布 b.9 个 自由 度 的 
a.f(x, y) 2 (1/25)expl - (x+y)/5} b.10 好 分 布 
独立 6.89 a.29 个 自由 度 的 X^4fg b. 0.05 
0. 375 . 6.93 a. 近似 正 态 , u, =43, 0, = 1.11 b. 近似 正 
-0. 447 l 态 , py =1050, 0, =59.45 c 近似 正 态 , u = 
- 1⁄5 : 24, g, 215.5 
a0 hb.0 695 afi(x) +x+1⁄2; f(y) =y+1⁄2 c.f. (xly) 
1.65; 3.46 +3. 30 =(x+y)/(y+1⁄2); f,(ylz) = (x +y)Z(x + 
E(p) =p, V(p) =pq/n 1/2) e 相关 ; 不 独立 £. E(d) = 5/12, 
flc) = (1/15)exp] — (c -2)/15] , c>2 V(d) =5/144; 0. 42 +0. 56 
Sw) = (u/2)e "^^; B -2y, 的 指数 分 布 6.97 a ~0 b.0.0094 
y 2 wi 其 中 w 是 (0, 1) 上 的 均匀 分 布 6.99 fw) - [023020 -2xw«8 
E(€) - 1M, V(£) 254.5 1/20, 8<w<23 
af(w)-l,0swsl bf(w)=(w+1)/2, 6.101 a 近似 正 态 ,w=121.74， c, =4. 86 
-Ixwxl c/f(w)-2/w,wzl b. 0. 7348 
a. u, =293, s, =119.8 c. 0. 0158 6.103 2.0.0043 b.0. 6065 


a. 0. 3264 b.1.881 c. 不 是 有 效 的 6.105 0.008 
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6.107 0.9332 7.69 2.(4.73,9.44) b. 可 能 满足 
6.113 a.1/3 b. 不 独立 7.71 (33.64, 392.78) 
6.117 f(w)-(1/B)e "5, 指数 7.73 a. (0.16, 29.14) b. C0, 测 量 值 近似 正 态 
6121 y-2/-ln(1-w) 7.75 4.2.40 b.3.35 c.1.65 d.5.86 
N 7.77 (0.0071, 0.1806) 
第 7 章 7.79 (1.53, 3.64); 有 
7.1 by 7.81 a.0.95 b.0.001 c97 
7.3 b.pqg/n 7.83 14 735 
7.9 ay b. 是 无 偏 的 7.85 mi =m =534 
7.11 a.y/2 b.E(B)= B, V(B) = BY(2n) 7.87 1729 
7.13 a.y b. ÆJ c. B?/n 7.93 bs = (z753) (0 80n +1) 


7.17 Y + zap V yfn 


7.95 1ES,u-2(n*1)(y £5/n)/n 

7.19. (yy — J2) £ zap V si/ni + s/n 7.97 97 
7.23 (9i — X3) + (tan)s, V Mn, + 1/m 7.99 a (0.44,17.81) b. 没有 不 同 的 证 据 
7.25 a. [49590 fF] BH u YEHE 13.6 - 26.4 之 间 7.101 a.0.23 £0.17 b.0.20 «0. 16 

b. 所 有 类 似 构 造 的 置信 区 间 中 的 95% 包 7-103 (0.0028,0. 0105) 

Su 7.105 193 
7.27 a 97.17 b.( -4.83, 199.16) c. MTBE 7-107 3.1083 b. SE c38% 

水 平 的 分 布 是 近似 正 态 的 ; 不 满足 s 7.109 0. 667 x0.077 
7.29 a， 所 有 阿拉 斯 加 的 地 衣 样 品 b. (0.0053, 7-111 2401 

0.0128) d. 近似 正 态 7.13 a 偏 =1/2 b.l/(12n) e7- 方 
7.31 a.2.89 + 4.03 b.0.4083 土 0.2564 
7.33 c.(1633.05, 2778.85) e. (1532.39, 2658.81) 7.115 c2yX5 «B«2y/yt an 
7.37 2.48.3236.77 b. 同意 第 8 = 
7.39 0.2+0.066 
7.41 -40 +95. 12 8.1 o =P(#B28 H, lH, 为 真 ); B = P( 83% H, AH, 为 
7.43 2.35 +1.645 假 ) 
7.45 a. (0.638, 1.722). bua 5p 83 a TI 型 b I% 
7.47 a. -38.9 20.0 b. 差 是 近似 正 态 的 c. 平 8.5 a.0.083 b.0.617 c.0.029 

均 残 留 水 平 不 同 8.11 H,:w=22, H,: p <22 
7.51. uu, - Man 的 95% 置信 区 间 为 : 0.000523 8-13 His 75) 20,H, : (j -m ) >0 

+0. 0004 8.15 H,:(u -po) =0,H,:(u, -1) #0 
7.53 0.5427 +0.0452 8.17 z-5.47, E% H, 
7.55 a.0.46 b. (0.433,0.487) 8.19 a M: w = l10,H,; p «10 cz- -2.33, 拒 
7.57 2.0.636 h.0.636 £0. 167 H H, 
7.59 a.0.644+0.099 b. 能 8.21 t- -1.39, 不 能 拒绝 所 
7.61 a.0.153 b.0.215 c. -0.061 +0.069 8.23 z=0. 87, 不 能 拒绝 已 

d 不 影响 8.27 2.0.3124 b.0.0178 c. ~0 d.0.1470 


7.63 a. -0.35+0.09 bp «p, 8.29 pH -0. 322, 不 能 拒绝 H, 

7.65 0.147 x0. 069 8.31 z= -1.55, 不 能 拒绝 H. 

7.67 2.14.0671 b.23.5418 c.23.2093 8.33 a 没有 , t= -1.22 b. 有 ,t= -4.20 
d.17.5346 e. 16. 7496 8.35 t=2.83, JE% H, 
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8. 37 


8. 39 


8.41 


po po po po go po po go 
uA 
o 


po go Qo po ce 
~ 
— 
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90 p go go 
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t= -2.05, 不 能 拒绝 H, 

a.1= —0.0187, 不 能 拒绝 H, 

b.t= -0.019, 不 能 拒绝 H, 

ai = -2.97, 不 能 拒绝 所 b. -0.4197; 不 能 
e.t=0.57, 不 能 拒绝 H,; -0.2274, 不 能 
d.:=3.23, 不 能 拒绝 H, 0.1923, 不 能 

Á, t= -0.713 

不 , 1=0.46 

不 同意 ,上 = -3.16, 拒绝 H: (mm -jw) =0 

a. Hy: p 20.10, H.:p <0.10 
b.z« -2.326 cz-2 -2.11 
21.33, 4E% H, 
a.2-2.44, 拒绝 H, b. 不 一 至 

z=1.83, E% H, 

z= -1.44, 不 能 拒绝 总 

"H,zz11.04 

a 不 存在 , z-1.80 b. 存在 , z= -4.01 

a. y =3031.4, JE% H, 

a. H): o° =0. 54,H,: o, >0.54 b. 0.7425 

c. y? =40.8, 不 能 拒绝 H, 

不 需要 , Y? =6.91 

a. F =17.79, 拒绝 H, 

F -2.47, 不 能 拒绝 H, 

a. RA, F = 1.09 

P(pz0.51x 229) =0.004, P(p <0.51x =29) 
20.996; 拒绝 H, 

WR P(u <u) > PQuzps) , 拒绝 H, 利用 均 
值 = (n+1)(y+5/n)/n, 方差 =1/(n+1) 的 
后 验 正 态 分 布 

a. :ot/o? = 1,H,;o1/o31 b.F-1.37 
c F«7.39 d.píf 20.20 e 不 能 拒绝 也 
a.0.066 b.0.942; 0.058 c. 0. 322; 0.678 

a 有 , z=1.99 b. 没有 , z=0.15 

a 没有 , 1= -2.20 c.0.1<8<0.5 

d. 0. 01 « p {È <0. 025 

a.z= —2.52, 拒绝 到 — b. 0. 0059 

不 ,下 =1.11 ' 

是 , z=3. 54 

是 , z=11.14 


d. 不 能 拒绝 H, 


第 9 章 


a. 颌 习惯 : 磨牙 , 咬牙 , 两 者 都 有 和 都 没有 


ww 


一 
UA 


° o o Y o x v io 
— E 
- w 


= 
o 


Nel 


.21 


c 0.50+0.127 d.0.23 «0.214 

3.0.44 £0.03] b. -0.23 +0.04 

a. 0. 175 20.028 b. -0.262 x0. 054 

3.0.275 +0.182 b. 0. 125 +0. 261 

X 72.39, 不 能 拒绝 H, 

X 72.76, 不 能 拒绝 H, 

y 722.6, 不 能 拒绝 为 

没有 ， XY 24.4 

a. H: 推 覆 体 与 叶 理 面 交 轴 是 独立 的 , Hu. 推 
覆 体 与 叶 理 面 交 轴 是 相关 的 ”b. 同意 

cx >5.99147 d 不 能 拒绝 H, 

y =4.39, 不 能 拒绝 H, 

a. 低 于 限度 / 私 用 井 = 81, 低 于 限度 /公用 
井 =72, 检测 / 私 用 井 222, 检测 /公用 间 =48 
b.y^ =8. 84, p {H =0.0028, 拒绝 H. c. EF 
限度 / 基 岩 = 138, 低 于 限度 /松散 = 15, 检测/ 


基 岩 = 63， 检 测 / 松 散 =7 doy —0,p- 
0. 9637, 不 能 拒绝 也 
a 不 满足 b 不 满足 c 满足 dX = 


1.03, 不 能 拒绝 H, 

a. true/yes 期 望 单 元 计数 小 于 5; 独立 性 的 刀 
a. FARER ANKAK 10 BUTS by = 
5.03, p (E 20. 17, 不 能 拒绝 H, c. 不 满足 
y 231.87, JE26 H, 

a. 期 望 的 单元 计数 小 于 5 b.6 个 可 能 的 表 
c. 观测 表 : 0.017; 其 余 表 : 0.143, 0.056, 
0.339, 0. 127, 0.017, 0.0006 d. 0.0176 

e. 同意 

a. 期 望 的 单元 计数 小 于 5 bp 值 =0. 2616， 
不 能 拒绝 H, 

# , y =508. 74 

X =0.32, 不 能 拒绝 H, 

Y =61.14, 拒绝 所 

a. 是 ,Xx =14.67 b. -0.169 +0.161 

a. BÉ, y =313.15 b. 0. 181 +0.069 

X 713.54, 拒绝 瓦 


第 10 章 


B, -1, B =l; yel ex 
a. y RE -3, 斜率 =2 by UB -1, 斜率 =1 
cy 截 距 = -2, 斜率 =3 d.y 截 距 =0, 斜率 = 
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10. 5 
10.7 
10.9 


10. 11 


10. 13 
10. 21 


10. 23 


10. 27 
10. 29 
10.31 
10. 33 


10. 37 


10. 39 
10. 41 
10. 43 
10. 47 
10. 49 

10.51 
10.53 


10. 59 


10. 61 
10. 63 


10. 65 
10. 67 


5 ey 截 距 =4, 斜率 = -2 
ay=p6+Bx+ei 负 的 b. 是 “不 
a. ý =6. 313 +0. 9665x d.15.98% 

ay = +Bx +e; 人 负 的 b.y = 189.81 — 
0.305x c. 负 的 

b. y 24. 79 +.014x 

a 是 b.B,-1.192, B, 20.987 

b. ý -1.265 40.589x c SSE 24.695, š = 
0.204 4d.0.452 

a. y =0. 62976 —0.000255x b. SSE = 11. 781, 
s? 20.0998 c.0.316 

a. -0.114 0.018 b.:- - 11.05, #E26 H, 
— 0. 0023 +0. 0016 

t=6.91, E% H, 

a. 可 能 b. 支持 c y- -8.524 41. 665x 
e 有 , 1=7.26 f.1.665 «0.464 

a.r-0.90, 7 20.81 b.rz0.80, r 20.64 
€r2-0.926,57 =0.857 d.r=0.871, 2 = 
0.759 er= -0.476, 2 20.22 f.r = 
0.794, 2 =0.63 g.r=0.915, r? -0.837 
h. r 20.951, 7? 20.905 

b、 两 者 都 是 正 的 c.0.706 

a.y=pB, +Bx+e 

€. TE a =0. 01 时 拒绝 总 

a. 15.98 +9.66 b. 15.98 +3. 66 

2.92 +2. 55 

4. 95 +0. 16 

ay=6.62 -0.073x b. $29.31 —0. 108x 

c 品牌 A: (2.76,3.94); 品牌 B: (4.17, 
4.76) d. 品牌 A; (1.12, 5.57); 品牌 B: 
(3.35, 5.58) e. ( -4.25, 2.96) 

a 能 b.0.612 ct=4.89, E% H, dr= 
0.309; :- 1.81, 不 能 拒绝 H, e 所 有 数据 : 
r= -0.880,i = -11.72, 拒 绝 H,; REWA.: 
r= -0.646, t= -4.71, #E# H, 

a 是 by=14.175 +0.02243x 

b. ý =308. 14 +41.7x ci=3.02, 不 能 拒 
# H, d.y -302.59 +64. 1x; :=4.79, JE 
绝 H, 

a. A; t=3.39 b.0.331 +0. 208 

d.0.903 e.:-20.85, 拒绝 有 £4.58 


10.60 a= -0.1124 € 0.0944x b. 有 用 ; i = 
11.39 c.0.926 +0. 197 
10.71 y 22.55 «2. 76x 
第 11 章 
18.8 1 12.0 
18.3 1 9.7 
16.3 1 7.3 
1L1 a Y= ;X= 
6.9 1 5.3 
17.1 1 10.9 
20.4 1 16.8 
1 62 97.8 
b. xx=| X - | 
62 720.52 1087. 78 
~ r6.3168 z 
dp8=| e. SSE =41. 1,5? =10. 3 
0. 9669 
f£. 3603 g. 0.967 +0.768 h.0.643 i. (8.56, 
23. 40) 
0 1 1 
0 1 2 
2 1 3 
1 1 4 
1 1 5 
1 1 6 
3 1 7 
11.3 a Y=|3|;X=|1 8 
2 1 9 
4 1 10 
4 1 11 
4 1 12 
3 1 13 
4 1 14 
5 1 15 
15 120 
b. xx=] QU 3M 
120 1240 386 
4 0.29524  —0.02857 
c. (X'X) -| ] 
—0.02857 0.00357 
~ r -0.1048 A 
= | d. SSE = 6. 805,5? = 0. 523 
0.3214 


e. t =7.43 ,JE26 H, 
g. ( -0.78,3.79) 


f. 0. 810 


AA 5t 





808 3X AB dp m 
0.231 1 740 1.10 作用 是 重要 的 
0. 107 1 740 0.62 11.27 ay = 10.625 + 2.4125x, + 0.2325x, - 
0. 053 1 740 0.31 0.4225x,x, b.F-74.57, dEÍ& H, c. d, 
0. 129 1 805 1.10 t= -6.91 
0. 069 1 805 0.62 11.29 a. E(y) 2, * Bux, * Boss + B,x + B,x, + Bux, 
0. 030 1 805 0.31 *Byx,x, +Brxsxs b. y 213645. 9 +0. 046x, — 
1.5 aY=i i oos P5] 980 1.10 12. 68x, + 23. 003x, - 3.023x, + 1. 288x; + 
0. 559 1 980 0.62 0.016x,x, -0.041x,x, €. t=4.40, JE26 H, 
0. 321 1 980 0.31 d. t= -3.77, JEZ H, 
2. 948 1 1235 1.10 11.31 a.E(y) Bo *tBix, ^ Box, t Box, Db. y = 
1. 633 1 1235 0.62 1.0077 -0. 00718x, +0. 51715x, — 0. 00599, x, 
0. 934 1 1235 0.31 c.t= -1.79, 拒绝 已 d. -0.03114 
12 11280 8.12 11.33 a. 向 下 弯曲 b.6.25 c.10.25 d.200 
b.X'X-|11280 11043750 7632.8 |; 11.35 a E(y)*By +x +B,” b. EH c 不 能 ; 
8.12 76328 6.762 E(y) =Bo +Bix 
8.019 11.37 a E(y) =B * Bx +B, b.y 20.334 - 
Y'Y- | 9131. 205 0. 810x +0. 941x? c. F =62.17, 拒绝 H, 
6.627 d.t = 836, E # H,:8, -0 eR = 
0. 196, s - 0. 088 
2. 43006 -0.00213 -0. 53387 11.39 a. 曲线 趋势 b. = 1.007 — 1.167x +0. 290x 
c | -0.00213 0.00000227 -4.88 x10" 
c. 4,127.36 
-0.58387 -488x107 — 0.78897 11.41 a.$ 285.014 +0. 04045x b. 合适, F -21. 77 
. -3.3727 c 没有 发 现 异常 ; y =777.0 是 不 平常 值 
d.8-| 0.00362 ;7 = —- 3. 3727 + 0. 00362x, d. 有 改进 e 模型 是 有 用 的 (p - 
0. 94760 0. 0001) ; Boston Harbor 残 差 为 z= -2.78 
+ 0.94760x, e0.406 £0.784 g. F = 11.43 合理 地 满足 假定 
20.90 ,拒绝 H, h.0.0036 +0.0011 10.948 1145 RAT; 有 影响 的 观测 值 是 #11, #32, #36 
+0.654 j. ( -0.126,1.427) KHAT 
11.7 a 4; F=17.8 b.t- -3.50, J H, 11.47 a. 发现 了 ; 违背 了 等 方差 的 假定 b. 利用 变 
c. -6.38 +4. 72 换 y* = /y 
1.17 b.F-3.72, 拒绝 如 ci=2.52, WAJE 11.49 不 ; 去 掉 重 要 性 (与 支持 度 较 高 的 相关 ) 
绝 H, 11. 51 无 能 力 检查 模型 恰当 性 ; 误差 的 自由 度 为 0 
11.19 aE(7y)=Bo+pBixi+Bx c 否 , t= -0.72 11.53 a7=2.743 40.801x,; Æ, (215.92. bb 了 = 
11.21 a E(y) 2 fl * Byxi +B,x, v Box, +B,x, + Bszš 1.665 + 12.395»; Æ, t = 11.76 c.f = 
b. y = 13614. 4 + 0.089x, — 9. 201x, + 14. 394x, + -11.795 +25. 068x; ;是 , £22.51 
0. 352x, -0. 848x, €. 458. 83 11.55 aĵ =0.132 - 9.307x, + 1.558%, b.F = 
11.23 a. E(y) =B, *Bix, +B,x, + B,x, + Bax, + Bs xs 35.84, 拒绝 H,(p ff =0.0005) c. 没有 ; 
+Be xs + Bıxı b.$ = 0.998 — 0.022x, + t=-1.84 d H;:-847 e.0.923 
0. 156x, - 0.017x, - 0.0095x, + 0.421x, + f.0.152 g ( - 0.296, 0.564) 
0.417:, -0.155x, d. F=5.29, jE% H R = 11.57 a.E(y)*B,*Bix «Bx! b. 图 支持 理论 
0. 625 ,s =0. 437 e ( —1.233,1.038) * €. f = 438. 31 — 1684. 27x + 2502. 28x? d. t= 


11.25 


a. E(y) =Bo +Bix, +B% * Byx,x, b. 交互 


5.32, 拒绝 H, 


J Ag 
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11. 59 


12.1 
12.3 


12.5 
12.7 


12.9 


12. 11 
12. 13 
12. 15 
12. 19 


12. 21 


12. 23 


12. 25 


12. 27 


a 二 次 b.y 248.64 4619. 76x — 13. 75x? 
c. t= —15.78, JE26 H, d. 188. 89. e. 0.994 
f. (6968. 3, 7317. 7) 

c. AJH, F -30. 45 

a. 可 能 是 曲线  b.y = 42.25 -0.0114x + 
0.000000608x c. Á, t=1.66 

a. 合理 地 满足 假定 ; 发 现 一 个 异常 值 
a.E(S,) -B, +Bix+Bx D. E(V,) =P, + 
Bix+B, c. 进行 方差 稳定 化 变换 da ç = 
96.55 + 0. 00823x - 0. 00000532x2; 97.67 
e.lg(y) =6.47 - 0.002373: f. 合适 , t= 
-5.36 g.(138.38, 1469. 97) 


第 12 章 


a. 硝酸 盐 浓 度 b. 水 源 ; 定性 
a 定量 b 定量 c 定性 d 定性 e € 
性 f. 定量 g. 定性 
a 定量 b 定量 c 定性 
a 一 阶 b 二 阶 c 三 阶 
阶 工 一 阶 
a. E(y) =B, * Bix, + B, (x, )° 
Bx, t Bi 0? +B, (x, )? 
b. E(y) - By * Bis e Box 
E(y) =B, +Bix 
t= -6.60, 拒绝 H: B, -0, SE H.: 8, «0 
a. E(y) =B, *Byx, * Box, * fx, b. 在 尾部 
振幅 离 差 和 尾部 速度 离 差 保 持 不 变 下 ,身体 
波 速 每 秒 增加 一 个 身长 , 游 速 的 增 量 
c. E(y) =B, * Byx, +B,x, + Boxs Bax x 
dB e,-p, 
a. 两 者 都 是 定量 的 hb. E(y) 2 By +Bix +B% 
c. E(y) =B, +B,z, +B,x; + Bx, 
d. E(y) =ñ, * Bix, + B,x, + B, z x, +B, (x, )° 
+B; (x, )° 
a. E(y) =B +B + B,x, + Bx, x, +B, (x, )? 
+Bs(x,)° b.E(y) =ñ, +B1x! +B,x, 
c. E(y) - By * By, +B,x, + Bux x, 
a. u = (x -0.344)/0. 152 b. — 1.270, 0.914, 
-0.612，- 0. 283, 0. 046, 0. 375, 1. 033, 1. 691 
c.0.984 d.0.412 e. ĵ=155 +4.91u +57. 81i? ; 
F-18.37, 模型 是 有 用 的 
a.u=(x-4.5)/2.45 b. - 1.429, - 1.021, 


d. —f e 二 


b. E(y) = B, + 


12. 20 


12.31 


12. 33 


12. 35 


12. 37 


12. 39 


12. 41 


-0. 612, —0. 204,0. 204,0. 612,1. 021,1. 429 
€0.976 dO ef= -0.656 + 105.07u + 
90. 61w ;F -26. 66, 模型 是 有 用 的 

a E(y) =B *Bixy t Bx, x, = 01, 如果 是 地 
下 水 ; 0, 如 果 不 是 | , = 01, 如 果 是 地 表 水 ; 
0, 如 果 不 是 | b. Bo = Harki Bi = yk 一 
Ps Ex à Bg “Musk T Hik 

a. E(y) =B, * Byx, + B,x, + B, x, + Baxa ,Xi = 
(1, WURJÉAE; 0, 如 果 不 是 } ,x, = 11, WE 
是 甲 茶 ; 0, 如 果 不 是 | , x; = 11, inde S 
Ù: 0, 如果 不是 | , % = |l, 如 果 是 甲醇 ; 0， 
如 果 不 是 | b. Bo eem: Bi =e -Hepi 
= Hpg 一 Kamm; Ds = Hay 一 xum Ba = 
MK 7 Hemp 

a. fH b.E(y)-By*B,x, *fx,.x, = 11, 如 
果 是 组 2; 0, 如 果 不 是 | , x, = (1, 如果 是 组 


3; 0, 如 果 不 是 | c B, =u, iB, =u, — u, ;B, = 
uz —u, 

a. E(y) =B, +Bix, x = 11, 如 果 不 会 飞 ; 0， 
其 他 | b E(y) =Ë +B, x, + B,x, + B, xx, 


x, = il, WREE; 0, 如 果 不 是 | ,x 
= {1， 如 果 是 植物 ; 0, WERE, x = 11, 
如 果 是 无 冰 椎 动物 ; 0, 如 果 不 是 | c. E(y) 
=Bo+Bz +B,x, + Bsx3, x, = |1, 如 果 是 地 
中 的 穴 ; 0, 如 果 不 是 | , x, = {1， 如 果 是 树 ; 
0, 如 果 不 是 } , x = 11, 如 果 是 地 面 上 的 洞 ; 


0， 如 果 不 是 | d. y =641 +30647x et = 
5.75, 拒绝 H, f.f =903 +2997x, + 26206x, 
-660x, g. F-8.43, E% H, h.y =73.732 


-9. 132x, - 45. 01x, — 39. 51x, 
拒绝 H, 
a. y = 20.4 + 4.75x, + 8.60x, + 11.31, + 
2.10x, c Ho:p =s =c =p =e 
d. F =23. 97, JE28 H, e.2.1 +2.85 
a. E(y) =B * Bix, +B;x, + Byxs + Bao, + Bsxs 
*Byxs ,其 中 x， -x 是 化 合 物 虚 拟 变 量 
c. E(y) =B, * Bix, + Box, + Bax, * pats + Bsxs 
+Bexaxs Box xa Bsx;xs + B, x;xç 
a. E(y) =B, +B,x, +B,x, € Bux, x, = {1, 如 是 
方法 G,0, 如 果 不 是 | x, = |1, 如 是 方法 R,, 
0, 如 果 不 是 } c. E(y) =P tB + B,x, + 
Bsxs Bux x, Box, x, d. Gi, * BiiRS B, 


iF-807, 
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tB Ry B, 12.69 a. E(y) =Ó, *Bix, * Box, * Bx, x, = 11, 如 
12.43 a E(y) =ñ, * Bux, * Box, [Bx x, = (1, 如 果 是 方案 B; 0, 如 果 不 是 | , x, = i1, 如果 是 
果 是 植物 ; 0， 如 果 是 鸭 食 | b7=8.14- 方案 C; 0, 如 果 不 是 | b. H,:8, =p, =0 
0. 016x, — 10. 4x, +0. 095x,x, ct.0.079 c. F -2.60, 不 拒绝 H, 
d. -0.016 e:-0.67, 不 能 拒绝 H, 12.71 E(y) =B, +B,x, * Box, +B,xix, Bax) + Box 
12.45 a. 品牌 一 一 定性 ; 大 小 一 一 定量 b.E(y) = 12.73 53 22.005 + 1.643x, +0.029x, + 0.0212x,x, — 
Bo +Bixi t Box, x, = |1, 如 果 是 榨 柳 汁 机 B; 0. 00000595x? — 0. 00000469x x2 
0, 如 果 不 是 | c BE Bx x, e HB =0 m 
XE H,:B, #0 第 13 章 
1.47 4, F=3.59 13.1 a 干扰 (变异 性 ) 和 量 ( 样 本 大 小 ) b. 消除 外 
12.49 a.E(y) =B, +Bix! +B,x, +B,xs + B,x, +Bsxs 部 变异 来 源 
* Boss + By, + Bexs + Bxo + Bizi + Bi x 13.3 a XEYR b. 是 c 试验 组 d1,2,3 


12. 51 
12. 53 


12. 55 


12. 57 


12. 59 
12. 61 
12. 63 
12. 65 


12.67 


b. E(y) =B, t Byxi +B,x, * Bax + Bax + Bs x; 
* Boxs + By, + Bass +Boxo + Box Bux + 
Bixixo +Biaxixio t Buxixy t Bisxuxs + Bist mio 
+Bin Xn + Big zs Xo + Bits Xo + Batx + 
Bus +Brxaxio +Brxaxi + Baxsxy + Bosxsxio 
+ Be Xs xu + B>; xe Xo + Bog xé Kio + Bz Xe X + 
Bo + Baie Bays xy + Bas xg xs + Bixa mio 
+Bssxsx1 € Ho: B, 25-2 =b 20 

F 224.19; 完全 二 阶 模型 更 有 用 

a. Ho:B, =B, =0 b. Hy: B, =B, -B, =0 

c RA, F =0. 93 

a.H,:B,=B,=0 b.F-6.99, JE% H, 

c. 检验 在 模型 E(y) =B + Bux, + B,x; + Bux, 
tax x, + Box xs HR BJ Ho: B, =f; =0 

d. E(y) =B * By, * Box, + B,x, Bao, * ps% 
X, Bex x, + B, x1 22 tex, e 检验 Hy: Bs 
=B, =P =Bs =0 

a.6; E(y) By *B,x; b.x, 因为 := -90 是 
最 大 的 绝对 值 . c 5;E(y) =Po +B,x, + Box, 
d. 当 所 有 余下 的 x 都 有 超过 a 的 显著 性 水 平 
e. 增加 了 至 少 犯 一 次 I 型 错误 的 概率 ; 不 包 
会 高 阶 项 或 交互 作用 项 

a.ll b.10 c1 dE(y)=pB, *Bix, x, + 

Bs, * Bax, +Bsxio + Bs) +B,xç + Bao, 

a. E(y) =B, +Bix! * Bo, 

没有 的 估计 

a. Ho: B, =Bs =0 b.H,:B,=B, zB, =0 

c. F =2. 15, 不 拒绝 H, 

a. E(y) 2 By +B,x, + Boss + Bx, + B, xi x, + 

Bsxix, b. E(y) 2 Bo * Bix, * yx, 


13. 7 


13. 11 


13. 13 
13. 15 
13. 17 
13. 23 


13. 25 


e3 f£ 总 消耗 量 gE(y)-B,tBx + Ba%, ， 
x = 人, 如果 是 组 1; 0, 如 果 不 是 | , ll, 
如 果 是 组 2; 0, 如 果 不 是 } 

a. 考虑 到 月 和 日 之 间 的 变异 b 加 利 福 尼 
亚 、 犹 他 和 阿拉 斯 加 “ 2000 Æ 11 月、2001 
年 10 A X 2001 4E 11 月 

a Ym =Bo +B; t Ba + £n ; ym = By + B, + B; + 
£pi 
ya.10 7 Bo + B, + Sano iya = By + B, + (B, +B; + 
e +B, )/10 + g, 

b. Ym =B +B, + gp;ym = By + Bs + Ep i; 
ypo 7o + £p40:Yp =Bo + (B, +Bs +-- +B, )/ 
10 +e, 

a. 析 因 设计 b 因子 1: 凝结 剂 的 水 平 (5， 
10, 20, 50, 100 和 200 mg/L) ; 因子 2: pH 水 
3E(4.0, 5.0, 6.0, 7.0, 8.0 819.0) ; AX; 
(5/4.0) ,(5/5. 0) ,(5/6.0) , =, (200/9.0) 
a 质量 b. 温度 (定量 ) , 压强 (定量 ) 

c. (1100/500), (1100/550), (1100/600), 
…, (1200/600) d. 钢锭 

a. 不 是 

df( 误 差 ) >0 

18 

E(y) 2 o * By, + Box, Bax, +Baxa +Bsxs + 
Bex) + Brxix3 + Bax x, + Boxixs + Boxx; + 
Bux, + Bn cox, + Bu xxx, + By X12254 + 
Biss x35 ;自由 度 为 0 

a.3 x3 析 因 b. 工资 率 ( 定 量 ), 工作 日 长 度 
(ŒE). c. PiL, PiL, PiL, P L, P.L, 
P,L,, PEL, P4L,, PL, F P, P, , PRIR 


习题 简 答 
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13. 27 


14.1 


14.5 


14.7 


14. 9 
14. 11 


14. 13 


14. 15 


14. 17 
14. 19 


14.21 


工资 率 的 三 个 水 平 , Loli, L, S N TE H K 
度 的 三 个 水 平 

a. 性 别 和 体重 b. 两 者 都 是 定性 的 c. 4; 
(ML), (MH), (FL) 和 (FH), 其 中 M. 男 ， 
F: ZK, L; 轻 , H: EE 


第 14 章 


a. 箱子 的 大 小 型 号 是 不 相同 的 b. 是 
c 由 于 较 大 的 变异 性 ,可 能 不 显著 
a. 拨 掉 的 牙齿 ; 粘 合 时 间 (1 h, 24 h sZ 48 h); 
折断 强度 b. Hy: jp = Hy =Ma € F>5.49 
d. 拒绝 H, e 每 种 处 理 的 折断 强度 是 等 方差 
的 正 态 分 布 
a. 安全 性 得 分 b.3 c Hy: uae = ia = 
Hawea d 7.065 e. 小 于 0.01 
a E(y) =B +Bix, x = |1, 如果 是 现 有 的 合 
4,0, 如 果 是 新 的 RAA 合金 | b. = 641 - 
48x; df(T) =1, df( E) =4, SST =3456, SSE = 
1040, MST = 3456, MSE = 260, F -13.29 
c. 3456 d.260 el f4 g F=13.29 
h. F>6.61 i JH, jt= -3.65, 拒绝 总 
L 双 侧 
dé, F-7.25, p ff =0. 0008 
b. 处 理 : EUER. FREE, 无 药 ; 响应 ; 回忆 
的 词 对 个 数 . “6. 167, 9.375, 10.625; 没有 ， 
没有 可 靠 性 的 度量 d 有, F=27.07, p (Ñ =0 
a. CM = 1691, 387. 13; SST = 357986. 87 
b. 1151.602 c.1509588.9 d. MST- 
89496. 72. MSE =15775.37, F-5.67 e 有 
a.3 个 位 置 (开始 位 置 、 改 变 旋转 方向 的 点 、 
结束 位 置 ) b. 10 名 学 生 c. 医学 旋 内 测量 
值 d 消除 由 于 学 生 旋 内 不 同 引 起 的 变异 
e. E(y) 2 By * By, + B,x, ene + Bux ,Xi = 
1, 如 果 是 开始 位 置 ; 0, 如 果 不 是 | ,x, = 
和 1 ,如果 是 改变 点 ; 0, WERE}, x, < x 是 
学 生 ( 区 组 ) 的 虚拟 变量 
F -57.99, JE% H, 
a. STAAD- 1, STAAD- 2, 位移 
p fi 20.043, 4546 H, 
a. E(y) =B, * Bx, + Box, e + Bitit, = 
{1, 如 果 全 上 暗 ; 0, 如 果 不 是 | , x, = 11, 如 果 
短暂 光亮 ; 0, 如 果 不 是 } > %3 ~xim 是 基因 (区 
组 ) 的 虚拟 变量 bH,;:g,28,-0 cF- 


c F =4.79, 


14. 23 


14. 25 


14. 27 


14. 29 


14.31 


14. 33 


5.33, p {H =0. 0056, 拒绝 五 

c. E(y) 2B, «Bi, +B,x, + Box, +Baxa + Bux x, 
*Boxixs t Bux m ux, = 11, 如 果 是 面包 酵母 ; 
0, 如 果 是 酿酒 酵母 |, x, = {1, 如果 是 45°; 
0, 如 果 不 是 | ,xs = 1, 如 果 是 485, 0, 如 果 
不 是 | , x = |1, 如 果 是 51°; 0, 如 果 不 是 | 

d. Ho: B; - B, =B, =0; 关于 交互 作用 项 的 部 
分 到 检验 e 拒绝 f 酵母 ; 进行 上 检验 
H;: B, =0; 温度 : ETT F RE HB, = p, = 
Ba =0 g. 存在 交互 作用 

没有 交互 作用 的 证 据 ; 没有 房间 次 序 主 效应 
的 证 据 ; 有 帮助 类 型 主 效应 的 证 据 . 

a. 观测 研究 b. 一 周 中 的 天 及 每 天 的 小 时 ; 
7 和 24 ca=7;5=24 d H,; 天 与 时 间 没 
有 交互 作用 e F-1.22, 不 拒绝 H, f. X: 
拒绝 H,, F=68.39; 时 间 : 4E% H, 
F-156.8 

a.7x2=14 个 实验 室 /方法 的 组 合 条 件 

c. df( 方 法 ) =1，SS (方法 ) =0. 00009 , MS( Jj 
ik) = 0.0000893 ，df (实验 室 ) = 6. SS( 实 验 
Æ) =0.00824, MS( 实验 室 ) = 0. 001374, df 
(方法 x 实验 室 ) =6，SS (方法 x 实验 室 ) = 
0.00019,MS (方法 x 实验 室 ) = 0. 000032, 
FOE) =6. 16,F( 实 验 室 ) =94.75,F( 方 法 
x 实验 室 ) =2.20 d. F, F -2.20, p fü = 
0.106 e 是 ,下 =94.75,p 值 =0 f 是 ， 
F «6.16, p {Ë =0. 026 

b. —Ér c E(y) 2B, * Byx, +B2x, + Bixi, 
e Ñ, t=0.55, p 值 =0.591 fy= -2.09528 + 
0.003684x, —0. 238x, +0. 000733x,x, g 2.71 

h. (2. 5772, 2. 8352) 

a E(y) =B, +B,x, * Box, +Bsxs * Bux, + Bsx z; 
+Bexixs +B,xix, Bax xs + B,x;x, + Bx x, + 
Buzix;xs Box xx, + Bls 212354 *tBux xx, + 
Bis*xyxm, b. df( 误 差 ) 20 e E(y) =ñ + 
Bizi + Bx; + B,xs + B,x, + Bs x, x, + Bex x, + 
B,xix, +Bsx;xs xx, +Bioxsxa d. y=5.95 
+ 0.338x, + 0.775x, + 0. 403x, + 1.008x, - 
0. 088x, x, + 0. 138x, x, — 0. 183x, x, + 0. 043x, x, 
-0.428x,x, -0.283x,x, e. 只 有 发 泡 剂 x 采 
集 器 的 交互 作用 是 显著 的 i 适当 ;发 泡 剂 
与 液体 的 主 效 应 ;两 者 在 a = 0. 10 时 是 显 
著 的 
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14.35 a. 存在 ,下 =74.16 b. 合金 x 时 间 , 合金 x b.75 145 616  c.167 978 841 d. MST = 
原料 92833225, MSE = 766792, F-121.07. 工 9 = 
14.37 a. F=304.6, JE% H,: B, 2B, =…=B=0 7834.67 +91.76x g. 9669. 87 +176. 43 
14.39 a3 b5 c15 dyy=uta +e;(i=1,2,3; h. 0. 553 
j21,2,7,5) e. 6f =0.00129,06 =0. 0558 第 15 章 
f. F =0.02, P =0.977, 不 拒绝 H, 
14.41 ”来 源 自由 度 15.1 a.H:r=300, H,:t>300 b.4 c.0.3438 
A( 生 产 批 ) 9 d. 不 拒绝 H, 
A 中 的 B( 生 产 批 中 的 批 ) 40 15.3 S=11,p 值 =0.4119; 不 拒绝 部 
B 中 的 C( 批 中 的 装运 批 ) 950 15.5 a Hr-21.5, H.:7>1.5 b.3 c.0.855 
总 和 999 d. 不 拒绝 H, 
14.43 b. ô? -0.038333,02,-0.057464 c 是 ; F= 157 z= -2.75, 不 拒绝 机 
6.34, p 值 =0. 0006 15.9 没有 ; $=4,p 值 =0.6367 
14.45 a6 b. «(us , Mé, Ho) 15.13 a 不 相等 的 方差 b.p f - 0.3431; 不 拒 
14.47 a6 b. 最 高 : 含 醇 母 面团 ; 最 低 : 控制 和 加 45 H 
酵母 膏 15.15 T, =35, 不 拒绝 所 
14. 49 (Hume -2 ,Lumaa -3 ) > (sp sPswna ) 15.17 没有 ; Ty, = 66 
14.51. 只 有 6 周 和 14 周 的 均值 没有 显著 差异 15.19 支持 ; z=3.91 
14. 53” 面包 醇 母 : pa < (Bas, Bas, Bar); 啤酒 醇 母 : 15.23 a. H,: 司机 和 乘客 的 受伤 等 级 分 布 是 相同 的 
Biss < (Bisu, Bal, Has) bT,-23 c T <19 d. 不 拒绝 已;p 值 = 
14.55. 不 相等 的 方差 0.0214 
14.57 不 相等 的 方差 15.25 HA; T, =23 
14.59 合理 地 满足 假定 15.27 T, =3, 不 拒绝 H, 
14.61 a. 完全 随机 化 b.E(y) =b +B +n, 1529 T. -0, 拒绝 本 
x = |1, 如 果 是 按键 音 ; 0, WERE], 2 — 1533 b.84 e145 417 eH=18.403 f jH 
11, 如果 是 人 工 操作 ; 0, 如果 不 是 | B. gz=3.38, 828 H, 
e Hina =a =s d HB =B, =0 e & 1535 a 非 正 态 分 布 c. 有 =2.97, 不 拒绝 本 
本 内 方差 较 大 15.37 H-16.27, JE% H, 
14.63 2.3 种 焊接 剂 ( 镍 , 铁 , 铜 ) b.7 个 铸 块 15.39 fë; H-11.08 
c. &, F=6.36 15.43 a. F,>9.21034 b. JE H, c. 不 拒绝 H, 
14.65 a. 不 存在 , F=0.39 b.F=19.17, 拒绝 H, d. 拒绝 H, 
14.67 能 , F-9.50, p {È =0.0061; uppi » pcs 15.45  F,-1.00, 不 拒绝 H, 
14.69 b. Æ, F-5.39 cy- -12.306-0.1875E 4. 15.47 F,=6.78, 不 拒绝 而 
0. 107 +0. 01125ET +0. 01708 E? +0. 001467? 15.49 b.r,-0.8286 c. A JE26 H, 
d.50.78 e. (85.22, 89.34) 15.51 b. 拒绝 导航 性 和 定位 性 的 H, 
14.71 a. 不 能 , F-2.32 b. 没有 , F-4.68 15.53 2.0.90 b. JE2 H, 
14.73 a 是 , F-40.78 b.x, x, x, € E(y)-g, 19.55 C-2.30, JE# H, 
+x, +B% t Bax, * Bax, + B;xix, + Box ms + 15.59 aHyr-5 b.z=6.07,p 值 =0 c. 拒绝 本 
Brxixa +Bex2xs + Boxx, + Boza x, + Buziz,Xs + 15.61 T. -0, JE% H, 
Braxixaxa + Bux x x, + BaX XX, + B s X xo xx, 15.63 ”不 能 表明 不 同 ; H =0. 98 
d 16 15.65 有 差异 ; F. =7. 85 
14.75 a. CM =8912304025; SST =92833225 15.67 a 不 ; F,=6.15 b. 不 ; F,=1.6 
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15.69 不 ; T, =106 16.49 x =1. 4985. LCL = 1. 4731. UCL = 1. 5239 
15.71 a 1.00 b. 4E% H, 16.51 %=5. 89667, LCL =5. 36471, UCL = 6. 42863, 
15.73 不 ; H=2.03 受 控 ; R=0.52, LCL 20, UCL - 1.339, 失控 
a 16.53 b 生产 方 风 险 : 计划 1 = 0.0815, 计划 
第 16 章 2 =0.0334; 推荐 计划 2 c. 使 用 方 风险 ; 计 
16.1 ax -22867 b.LCL = -170.84，UCL = 划 1 =0. 5282, 计划 2 =0. 1935; 推荐 计划 2 
628.18 c. 受 控 16.55 a n=32.a=7 b.n=50.a=10 
16.3 a.x -5.895, LCL -4. 836, UCL = 6. 954 16.57 a 0.0755 5.0.6769 d.n-125, a-10 
b. 受 控 e.0.041 £0.564 
16.5 a.z=0.13974, LCL =0. 1313, UCL =0. 1482 16.59 a. p=0.0614, LCL =0. 0105, UCL =0. 1124 
b. ZE b. 不 能 
16.7 a.x-0.9958 b.LCL =0.9531, UCL = 1. 0385 16.61 b. RA; C,«I 
d. 受 控 
16.9 a.x =54.261, LCL = 52.671, UCL = 55. 852 第 17 章 
b. 失控 c. 不 能 17.1 入 
16.11 a.x=0.14065, LCL = 0. 13565, UCL =0. 14565 17.3 a.f(0) = 0.0044, F(0) = 0.0013,z(0) = 
c. 受 控 . 0.0044;/(1) =0.0540,F(1) =0.0228,z(1) = 
16.13 a.R=0.074 b. LCL =0, UCL = 0. 15651 0.0553;f(2) = 0. 2420, F(2) = 0. 1587,z(2) 
c XH -0. 2876; 
16.15 a.R-2.756, LCL-0, UCL =5. 826 b. 变异 JB) =0. 3989,F(3) =0. 5000,z(3) =0. 7979; 
c 什么 也 没有 (4) =0.2420,F(4) -0.8413,2(4) - 1.5247, 
16.17 R-0.00867, LCL -0, UCL =0. 01833; 受 控 KS) -0.0540, F(5) =0. 9772,z(5) -2. 3680; 
16.19. fr d 和 f 中 有 趋势 f(6) =0.0044,F(6) =0.9987,z(6) =3. 4091 
16.21 没有 趋势 7.5 aF(t)-1-ep(-£0Ü10) bR(t)= 
16. 23 ”没有 趋势 exp( -£/100) (t) 21/50. e R(8) =0.5273; 
16.25 4/1(1,-0.0008, UCL-0.0202 b. 受 控 z(8) =0. 16 
16.27 b.p =0.075 e LCL = 0, UCL = 0. 25169; 17.7 a. 9.45057 x10" b.3. 7211x1025 
受 控 c. 0. 006578 
16.29 b.p-0.2571 c. LCL =0. 0717, UCL = 0. 4426 17.9 a (384.73,847.57) b. 0. 00118,0. 00260 
d. 失控 ; p 20.247, LCL 20.064, UCL = 17.11. (211.4,394, 5) 
0.430 e 没有 趋势 17.13 (18041. 27 ,294622. 44) 
16.3] b.ë=6.5 cLCL-0, UCL 214.15; 受 控 N 
d 没有 趋势 17. 15 = 1.9879, 8 = 16.029 b. (1.9405, 
16.33 a 失控 b 没有 趋势 2.0353) c. (14. 9423,17. 1947) 
16.35 a. 54. 26125 + 3.92272 b. 不 满足 co93;n 17.17 az(t)=0.124 p, 2(4) -0, 4877 
ES 17.19 a9,4,2 b. = 1.6938, ĝ 23.326 co. 
16.37 a. 26+29.11; (1 -a) -1.00 b. 特殊 原因 ( -0.7335,4. 1211) ,8: (0. 5383,20. 5250) 
16.39 6c d. 0. 6219 
16.41 b.15.2% c. 0.5045; 过 程 没有 能 力 17.21 0.60192 
16.43 b.5196 c.3.997 d. 有 17.23 a 串联 b.(1-p))(1-p,)-«(1 py) 
16.45 a. 0.5490, 0. 1671, 0. 0353, 0.0052, 0. 000488 17.25 0.99507 
b. 0. 1710 c.0. 1671 17.27 a.0.983 b.0.632 
16.47 2.0.0246 b. 0. 5443 17.29 2.0.8671 b.0.1424 c.0.000195 
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17.31 a. F(t)=t/B,R(t) =1 -t/B,z(t) =1⁄/(8 -t) 
c. 0.6 

17.33 a.&=2.0312, 827.3942 b.z(t)= 
(0.2747): 9? R(t) =exp( - 7^9"? 7/7, 3942 
c. 0. 8735 

17.35 0.0608 

17.37 a. (2153. 3 ,17322.3) b. 0. 4284, (0. 1560, 
0.7938) c. 0. 000212; (0. 0000577 ,0. 0004644) 

17.39 0.9613 
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10 0 20 vı 60 
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